Uogólnione liniowe modele mieszane: diagnostyka


11

Mam losową regresję logistyczną przechwytującą (z powodu powtarzających się pomiarów) i chciałbym przeprowadzić diagnostykę, szczególnie dotyczącą wartości odstających i wpływowych obserwacji.

Spojrzałem na pozostałości, aby zobaczyć, czy istnieją spostrzeżenia, które się wyróżniają. Ale chciałbym też spojrzeć na coś w rodzaju odległości Cooka lub DFFITS. Hosmer i Lemeshow (2000) twierdzą, że z powodu braku modelowych narzędzi diagnostycznych dla skorelowanych danych, wystarczy dopasować zwykły model regresji logistycznej, ignorując korelację, i użyć narzędzi diagnostycznych dostępnych dla regularnej regresji logistycznej. Twierdzą, że byłoby to lepsze niż wcale nie przeprowadzanie diagnostyki.

Książka pochodzi z 2000 roku i zastanawiam się, czy są teraz dostępne metody diagnostyki modeli z regresją logistyczną efektów mieszanych? Jakie byłoby dobre podejście do sprawdzania wartości odstających?

Edytuj (5 listopada 2013 r.):

Z powodu braku odpowiedzi zastanawiam się, czy diagnostyka przy użyciu modeli mieszanych nie jest ogólnie przeprowadzana, czy raczej nie jest ważnym krokiem podczas modelowania danych. Pozwólcie, że sformułuję moje pytanie: co robisz, kiedy znalazłeś „dobry” model regresji?


Możliwy duplikat podobnego niedawnego pytania, na które również nie zwrócono tak dużej uwagi: stats.stackexchange.com/q/70783/442
Henrik

Pomocna może być moja odpowiedź na podobne pytanie.
Randel

Odpowiedzi:


2

Metody diagnostyczne są rzeczywiście różne dla uogólnionych liniowych modeli mieszanych. Rozsądny, który widziałem, oparty na pozostałościach z GLMM, jest spowodowany przez Pan i Lin (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x). Wykorzystują skumulowane sumy reszt, gdzie porządek jest narzucany albo przez zmienne objaśniające, albo przez predyktor liniowy, testując w ten sposób specyfikację formy funkcjonalnej danego predyktora lub funkcję połączenia jako całości. Rozkłady zerowe oparte są na symulacjach z przestrzeni projektowej z rozkładu zerowego prawidłowych specyfikacji i wykazały przyzwoity rozmiar i właściwości mocy tego testu. Nie dyskutowali konkretnie o wartościach odstających, ale mogę sobie wyobrazić, że wartości odstające powinny prawdopodobnie zrzucić przynajmniej funkcję link, zakrzywiając ją zbyt mocno w kierunku wpływowej obserwacji.


0

Istnieje wiele różnych opinii na temat tego, jak najlepiej spojrzeć na diagnostykę modeli mieszanych. Ogólnie rzecz biorąc, będziesz chciał przyjrzeć się zarówno pozostałym, jak i standardowym aspektom, które zostałyby zbadane dla modelu z powtarzanymi pomiarami.

Oprócz tych, zazwyczaj będziesz chciał również przyjrzeć się losowym efektom. Metody często obejmują wykreślanie efektów losowych według różnych zmiennych towarzyszących i poszukiwanie nienormalności w rozkładzie efektów losowych. Istnieje wiele innych metod (niektóre wspomniane w poprzednich komentarzach), ale zazwyczaj jest to dobry początek.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.