Pracuję na wielokrotnej regresji logistycznej w R użyciem glm. Zmienne predykcyjne są ciągłe i kategoryczne. Wyciąg z podsumowania modelu pokazuje, co następuje: Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 2.451e+00 2.439e+00 1.005 0.3150 Age 5.747e-02 3.466e-02 1.658 0.0973 . BMI -7.750e-02 7.090e-02 -1.093 0.2743 ... --- Signif. codes: 0 …
Znam pojęcie zmiennych kategorialnych i odpowiednie kodowanie zmiennych zastępczych, które pozwalają nam dopasować jeden poziom jako poziom podstawowy, aby uniknąć kolinearności. Znam również sposób interpretacji oszacowań parametrów z takich modeli: Przewidywana zmiana wyniku dla danego dopasowanego poziomu predyktora jakościowego w stosunku do kategorii podstawowej. Nie jestem pewien, jak interpretować zestaw …
Korzystam z RandomForestpakietu R i nie rozumiem, jak interpretować wartości osi Y na ich wykresach częściowej zależności. Dokumenty pomocnicze stwierdzają, że wykres jest „graficznym przedstawieniem marginalnego wpływu zmiennej na prawdopodobieństwo klasowe”. Nadal jednak nie rozumiem, co dokładnie reprezentuje oś y. W szczególności, co oznaczają wartości ujemne? Co to znaczy mieć …
Zapoznam się ze statystykami bayesowskimi, czytając książkę Doing Bayesian Data Analysis autorstwa Johna K. Kruschke znaną również jako „książkę o szczeniętach”. W rozdziale 9 przedstawiono modele hierarchiczne na tym prostym przykładzie: a obserwacje Bernoulliego to 3 monety, każde 10 rzutów. Jeden pokazuje 9 głów, drugi 5 głów, a drugi 1 …
W przypadku części zadania domowego poproszono mnie o obliczenie skróconej średniej dla zbioru danych poprzez usunięcie najmniejszej i największej obserwacji oraz o interpretację wyniku. Średnia obcięta była niższa niż średnia nieprzycięta. Z mojej interpretacji wynika, że było to spowodowane dodatnim wypaczeniem leżącego u podstaw rozkładu, więc lewy ogon jest gęstszy …
Załóżmy, że mamy model liniowy Model1i vcov(Model1)daje następującą macierz: (Intercept) latitude sea.distance altitude (Intercept) 28.898100 -23.6439000 -34.1523000 0.50790600 latitude -23.643900 19.7032500 28.4602500 -0.42471450 sea.distance -34.152300 28.4602500 42.4714500 -0.62612550 altitude 0.507906 -0.4247145 -0.6261255 0.00928242 W tym przykładzie, co faktycznie wyświetla ta macierz? Jakie założenia możemy bezpiecznie przyjąć dla naszego modelu i …
Krótki wpis na stronie internetowej NY Times zawiera Fakty i liczby dotyczące konsumpcji pizzy w Stanach Zjednoczonych. Interesująco interesuje mnie sposób, w jaki statystyki są wykorzystywane (lub nadużywane) w celu dostarczania informacji ogółowi odbiorców, a na podstawie przedstawionych statystyk pojawiło się kilka pytań: Jeśli 1 na 8 Amerykanów zje dzisiaj …
Myli / wieje, że dwumian ma wariancję proporcjonalną do . Odpowiednio informacja Fishera jest proporcjonalna do . Jaki jest tego powód? Dlaczego informacja Fisher jest zminimalizowana przy ? To znaczy, dlaczego wnioskowanie jest najtrudniejsze przy ?1p ( 1 - p )p(1-p)p(1-p) p=0,5p=0,51p ( 1 - p )1p(1-p)\frac{1}{p(1-p)}p = 0,5p=0,5p=0.5p = …
Czy w regresji logistycznej zawierającej tylko warunki liniowe i kwadratowe, jeśli mam współczynnik liniowy i współczynnik kwadratowy , czy mogę powiedzieć, że istnieje punkt zwrotny prawdopodobieństwa na ?β 2 - β 1 / ( 2 β 2 )β1β1\beta_1β2β2\beta_2−β1/(2β2)−β1/(2β2)-\beta_1 / (2\beta_2)
Obecnie pracuję nad budowaniem modelu predykcyjnego dla wyniku binarnego na zbiorze danych z ~ 300 zmiennymi i 800 obserwacjami. Dużo przeczytałem na tej stronie o problemach związanych z regresją krokową i dlaczego jej nie używać. Czytałem o regresji LASSO i jej możliwościach wyboru funkcji i udało mi się ją wdrożyć …
Użyłem kmeansinstrukcji R do wykonania algorytmu k-średnich w zestawie danych tęczówki Andersona. Mam pytanie dotyczące niektórych parametrów, które otrzymałem. Wyniki są następujące: Cluster means: Sepal.Length Sepal.Width Petal.Length Petal.Width 1 5.006000 3.428000 1.462000 0.246000 W takim przypadku, co oznacza „klaster”? Czy jest to średnia odległości wszystkich obiektów w klastrze? Również w …
Czy ktoś może wyjaśnić, jak obliczyć marginalny efekt modelu Probit i Logit w kategoriach laika? Jestem nowy w statystyce i jestem zdezorientowany co do tych dwóch modeli.
Mam model regresji liniowej, w którym zmienna zależna jest rejestrowana, a zmienna niezależna jest liniowa. Współczynnik nachylenia dla kluczowej zmiennej niezależnej jest ujemny: . Nie jestem pewien, jak interpretować.- .0564-.0564-.0564 Czy używam wartości bezwzględnej, a następnie zmieniam ją na ujemną w następujący sposób: ( exp( 0,0564 ) - 1 ) …
Rozważ następujący kod i wynik: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") Wydaje się, że wykres QQ dla log-normal jest prawie taki sam …
Oto wykres QQ dla mojej próbki (zwróć uwagę na logarytmiczną oś Y); :n=1000n=1000n = 1000 Jak wskazał whuber, oznacza to, że leżący u podstaw rozkład jest przekrzywiony w lewo (prawy ogon jest krótszy). shapiro.testW=0.9718W=0.9718W = 0.97185.172⋅10−135.172⋅10−135.172\cdot10^{-13}H0:the sample is normal distributedH0:the sample is normal distributedH_0 : \text{the sample is normal distributed} …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.