Pytania otagowane jako generalized-linear-model

Uogólnienie regresji liniowej pozwalające na relacje nieliniowe za pomocą „funkcji łącza” oraz na wariancję odpowiedzi zależną od przewidywanej wartości. (Nie należy mylić z „ogólnym modelem liniowym”, który rozszerza zwykły model liniowy na ogólną strukturę kowariancji i reakcję wielowymiarową).

2
Czy używanie danych zliczania jako zmiennej niezależnej narusza którekolwiek z założeń GLM?
Chciałbym zastosować dane zliczania jako zmienne towarzyszące przy dopasowaniu modelu regresji logistycznej. Moje pytanie brzmi: Czy naruszam jakiekolwiek założenie modeli logistycznych (a bardziej ogólnie uogólnionych modeli liniowych), stosując jako zmienne niezależne zliczające, nieujemne zmienne całkowite? W literaturze znalazłem wiele odniesień dotyczących wykorzystania danych zliczających jako wyniku, ale nie jako zmiennych …


3
Czy wyniki testów naprawdę mają normalny rozkład?
Próbowałem dowiedzieć się, które dystrybucje używać w GLM, i trochę się zastanawiam, kiedy użyć normalnej dystrybucji. W jednej części mojego podręcznika jest napisane, że rozkład normalny może być dobry do modelowania wyników egzaminów. W następnej części pyta się, jaka dystrybucja byłaby odpowiednia do modelowania roszczenia z tytułu ubezpieczenia samochodu. Tym …

3
Czy w GLM prawdopodobieństwo dziennika modelu nasyconego zawsze wynosi zero?
Jako część danych wyjściowych uogólnionego modelu liniowego do oceny modelu wykorzystywane są odchylenie zerowe i rezydualne. Często widzę formuły dla tych wielkości wyrażone jako prawdopodobieństwo dziennika modelu nasyconego, na przykład: /stats//a/113022/22199 , Regresja logistyczna: jak uzyskać model nasycony Model nasycony, o ile rozumiem, jest modelem, który doskonale pasuje do obserwowanej …

2
R: funkcja glm z rodziną = specyfikacja „dwumianowa” i „waga”
Jestem bardzo zdezorientowany, jak waga działa w glm z rodziną = „dwumianowy”. W moim rozumieniu prawdopodobieństwo glm z rodziną = „dwumianowy” jest określone w następujący sposób: f(y)=(nny)pny(1−p)n(1−y)=exp(n[ylogp1−p−(−log(1−p))]+log(nny))f(y)=(nny)pny(1−p)n(1−y)=exp⁡(n[ylog⁡p1−p−(−log⁡(1−p))]+log⁡(nny)) f(y) = {n\choose{ny}} p^{ny} (1-p)^{n(1-y)} = \exp \left(n \left[ y \log \frac{p}{1-p} - \left(-\log (1-p)\right) \right] + \log {n \choose ny}\right) gdzie yyy …



1
R-kwadrat w odchyleniu wersetów w modelu liniowym w uogólnionym modelu liniowym?
Oto mój kontekst dla tego pytania: Z tego co mogę powiedzieć, nie możemy uruchomić zwykłej regresji metodą najmniejszych kwadratów w R, gdy używamy danych ważonych i surveypakietu. Tutaj musimy użyć svyglm(), który zamiast tego uruchamia uogólniony model liniowy (który może być tym samym? Jestem tutaj rozmyty pod względem tego, co …

1
Założenia uogólnionego modelu liniowego
Stworzyłem uogólniony model liniowy z pojedynczą zmienną odpowiedzi (ciągła / normalnie rozłożona) i 4 zmiennymi objaśniającymi (z których 3 to czynniki, a czwarta to liczba całkowita). Użyłem rozkładu błędów Gaussa z funkcją łącza tożsamości. Obecnie sprawdzam, czy model spełnia założenia uogólnionego modelu liniowego, którymi są: niezależność Y poprawna funkcja łącza …

2
Używanie R dla GLM z rozkładem gamma
Obecnie mam problem ze zrozumieniem składni R dla dopasowania GLM przy użyciu rozkładu gamma. Mam zestaw danych, w którym każdy wiersz zawiera 3 współzmienne ( ), zmienną odpowiedzi ( ) i parametr kształtu ( ). Chcę modelować skalę rozkładu gamma jako funkcję liniową 3 zmiennych towarzyszących, ale nie rozumiem, jak …

1
Interpretacja wyników .L i .Q z ujemnego dwumianowego GLM z danymi kategorialnymi
Właśnie uruchomiłem ujemny dwumianowy GLM i to jest wynik: Call: glm.nb(formula = small ~ method + site + depth, data = size.dat, init.theta = 1.080668549, link = log) Deviance Residuals: Min 1Q Median 3Q Max -2.2452 -0.9973 -0.3028 0.3864 1.8727 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.6954 0.1152 …

1
Jaka jest różnica między regresją logistyczną a regresją ułamkową?
O ile mi wiadomo, różnica między modelem logistycznym a modelem odpowiedzi ułamkowej (frm) polega na tym, że zmienna zależna (Y), w której frm wynosi [0,1], ale logistyka to {0, 1}. Ponadto, frm używa estymatora quasi-prawdopodobieństwa do określenia jego parametrów. Zwykle możemy użyć glmdo uzyskania modeli logistycznych przez glm(y ~ x1+x2, …

2
dyspersja w summary.glm ()
Przeprowadziłem glm.nb przez glm1<-glm.nb(x~factor(group)) gdzie grupa jest kategorialna, a x jest zmienną metryczną. Kiedy próbuję uzyskać podsumowanie wyników, otrzymuję nieco inne wyniki, w zależności od tego, czy używam summary()lub summary.glm. summary(glm1)daje mi ... Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 0.1044 0.1519 0.687 0.4921 factor(gruppe)2 0.1580 0.2117 0.746 0.4555 …

1
Zrozumienie prognoz regresji logistycznej
Moje przewidywania pochodzące z modelu regresji logistycznej (glm w R) nie są ograniczone od 0 do 1, jak bym się spodziewał. Rozumiem, że regresja logistyczna polega na tym, że parametry wejściowe i modelowe są łączone liniowo, a odpowiedź jest przekształcana w prawdopodobieństwo za pomocą funkcji logit link. Ponieważ funkcja logit …

1
Techniki analizy wskaźników
Szukam porad i komentarzy dotyczących analizy wskaźników i stawek. W dziedzinie, w której pracuję, analiza wskaźników jest powszechna, ale przeczytałem kilka artykułów, które sugerują, że może to być problematyczne, myślę o: Kronmal, Richard A. 1993. Ponownie zbadano fałszywą korelację i błędność standardu współczynnika. Journal of Royal Statistics Society Series A …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.