Odpowiadając na to pytanie, John Christie zasugerował, że dopasowanie modeli regresji logistycznej należy oceniać poprzez ocenę reszt. Znam sposób interpretowania reszt w OLS, są one w tej samej skali co DV i bardzo wyraźnie różnica między y przewidywana przez model y. Jednak w przypadku regresji logistycznej w przeszłości zwykle badałem szacunki dopasowania modelu, np. AIC, ponieważ nie byłem pewien, co będzie oznaczać wartość rezydualna dla regresji logistycznej. Po spojrzeniu na pomoc R w plikach trochę widzę, że w R istnieje pięć rodzajów reszt GLM dostępnych c("deviance", "pearson", "working","response", "partial")
. Plik pomocy odnosi się do:
- Davison, AC i Snell, EJ (1991) Resztki i diagnostyka. W: Teoria statystyczna i modelowanie. Na cześć Sir Davida Coxa, FRS , red. Hinkley, DV, Reid, N. i Snell, EJ, Chapman & Hall.
Nie mam kopii tego. Czy istnieje krótki sposób na opisanie sposobu interpretacji każdego z tych typów? Czy w kontekście logistycznym suma kwadratów reszt zapewni znaczącą miarę dopasowania modelu, czy może lepiej jest z Kryterium Informacyjnym?
binnedplot
funkcja w ramieniu pakietu R daje bardzo pomocny wykres reszt. Jest ładnie opisany na str. 97-101 Gelman i Hill 2007 .