Ocena modeli regresji logistycznej


13

To pytanie wynika z mojego faktycznego zamieszania dotyczącego tego, jak zdecydować, czy model logistyczny jest wystarczająco dobry. Mam modele, które wykorzystują stan par projekt indywidualny dwa lata po ich uformowaniu jako zmienna zależna. Wynik jest udany (1) lub nie (0). Mam zmienne niezależne mierzone w czasie tworzenia par. Moim celem jest sprawdzenie, czy zmienna, która, jak podejrzewałem, wpłynie na sukces par, ma wpływ na ten sukces, kontrolując inne potencjalne wpływy. W modelach zmienna zainteresowania jest znacząca.

Modele oszacowano za pomocą glm()funkcji w R. Aby ocenić jakość modeli, zrobiłem kilka rzeczy: domyślnie glm()daje ci residual deviance, the AICi BIC. Ponadto obliczyłem poziom błędu modelu i narysowałem skumulowane reszty.

  • Kompletny model ma mniejsze odchylenie resztkowe, AIC i BIC niż inne modele, które oszacowałem (i które są zagnieżdżone w pełnym modelu), co prowadzi mnie do wniosku, że ten model jest „lepszy” niż inne.
  • Wskaźnik błędu modelu jest dość niski, IMHO (jak w Gelman i Hill, 2007, s. 99 ):
    error.rate <- mean((predicted>0.5 & y==0) | (predicted<0.5 & y==1)około 20%.

Jak na razie dobrze. Ale kiedy planuję resztki bin (ponownie zgodnie z radami Gelmana i Hilla), duża część pojemników nie mieści się w 95% CI: Działka Binned Residuals

Ta fabuła prowadzi mnie do wniosku, że w modelu jest coś zupełnie nie tak. Czy to powinno doprowadzić mnie do wyrzucenia modelu? Czy powinienem uznać, że model jest niedoskonały, ale zachować go i zinterpretować efekt zmiennej zainteresowania? Bawiłem się z wykluczaniem z kolei zmiennych, a także pewną transformacją, bez poprawiania wykresu binned residuals.

Edytować:

  • W tej chwili model ma kilkanaście predyktorów i 5 efektów interakcji.
  • Pary są „względnie” niezależne od siebie w tym sensie, że wszystkie powstają w krótkim okresie czasu (ale nie ściśle mówiąc, wszystkie jednocześnie) i istnieje wiele projektów (13 tys.) I wiele osób (19 tys. ), więc do sporej części projektów dołącza tylko jedna osoba (istnieje około 20000 par).

2
Y

1
Na podstawie tego, co mówisz, wielkość próby nie wydaje się stanowić problemu, ponieważ mam około 20000 tysięcy par (z czego około 20% kończy się sukcesem).
Antoine Vernet,

Odpowiedzi:


11

Dokładność klasyfikacji (poziom błędu) jest niewłaściwą zasadą punktacji (zoptymalizowaną przez fałszywy model), arbitralną, nieciągłą i łatwą do manipulacji. W tym kontekście nie jest to konieczne.

Nie podałeś, ile jest predyktorów. Zamiast oceniać dopasowanie modelu, chciałbym po prostu dopasować model. Podejście kompromisowe polega na założeniu, że interakcje nie są ważne i umożliwieniu ciągłym predyktorom nieliniowości za pomocą splajnów regresji. Narysuj szacunkowe relacje. rmsPakiet w R sprawia, że wszystko to stosunkowo łatwe. Więcej informacji można znaleźć na stronie http://biostat.mc.vanderbilt.edu/rms .

Możesz rozwinąć kwestię „par” i tego, czy twoje obserwacje są niezależne.


Jeśli dobrze rozumiem, twoja rada polega na skoncentrowaniu się na fabule pozostałości i zrobieniu tego prosto, zanim zrobisz cokolwiek innego, w końcu używając splajnów regresji, czy mam rację? Zredagowałem pytanie, aby określić, ile jest predyktorów i czy pary są „względnie” niezależne.
Antoine Vernet,

Cześć @Frank. Dlaczego mówisz, że dokładność klasyfikacji jest złą metodą? Czy to dlatego, że ocenia się tutaj te same dane, z których pochodzi model?
Peter Flom - Przywróć Monikę

2
χ2c

2
Nie, mam na myśli umożliwienie ciągłym predyktorom działania nieliniowego na skali logarytmicznej, poprzez rozszerzenie ich na wiele wyrażeń przy użyciu ograniczonych sześciennych splajnów (naturalnych splajnów). Następnie wykreśl szacunkowe przekształcenia, aby dowiedzieć się o częściowych skutkach każdego predyktora.
Frank Harrell,

1
Dzięki za wkład, który był bardzo pomocny. Zagłębiając się bardziej w dane, zdałem sobie sprawę, że mam problemy z kolinearnością (nawet jeśli nie miałem wysokich korelacji par).
Antoine Vernet

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.