Na stronie 232 „towarzysza R do regresji stosowanej” notatka Fox i Weisberg
Tylko rodzina Gaussa ma stałą wariancję, a we wszystkich innych GLM wariancja warunkowa y w zależy od
Wcześniej zauważają, że wariancja warunkowa Poissona wynosi a dwumianowa to .
Dla Gaussa jest to znane i często sprawdzane założenie (homoscedastyczność). Podobnie często postrzegam warunkową wariancję Poissona omawianą jako założenie regresji Poissona wraz ze środkami zaradczymi w przypadkach jej naruszenia (np. Ujemny dwumianowy, nadmuchany zero itp.). Jednak nigdy nie widzę omawianej warunkowości dla dwumianu jako założenia regresji logistycznej. Mały Googling nie znalazł o tym żadnej wzmianki.
Czego tu brakuje?
EDYTUJ po komentarzu @whuber:
Zgodnie z sugestią przeglądam Hosmer i Lemeshow. To interesujące i myślę, że pokazuje, dlaczego ja (i być może inni) są zdezorientowani. Na przykład słowa „założenie” nie ma w indeksie książki. Ponadto mamy to (s. 175)
W regresji logistycznej musimy polegać przede wszystkim na ocenie wizualnej, ponieważ rozkład diagnozy pod hipotezą, że model pasuje, jest znany tylko w niektórych ograniczonych ustawieniach
Pokazują całkiem sporo wykresów, ale koncentrują się na wykresach rozrzutu różnych reszt w stosunku do szacowanego prawdopodobieństwa. Wykresy te (nawet dla dobrego modelu, nie mają wzoru „plamistego” charakterystycznego dla podobnych wykresów w regresji OLS i dlatego są trudniejsze do oceny. Ponadto nie wykazują nic podobnego do wykresów kwantylowych.
W R, plot.lm oferuje ładny domyślny zestaw wykresów do oceny modeli; Nie znam ekwiwalentu regresji logistycznej, chociaż może być w jakimś pakiecie. Może to być spowodowane tym, że dla każdego typu modelu potrzebne byłyby różne wykresy. SAS oferuje pewne działki w PROC LOGISTIC.
Z pewnością wydaje się, że jest to obszar potencjalnego zamieszania!