To dość stare pytanie z kilkoma bardzo dobrymi odpowiedziami, jednak myślę, że można skorzystać z nowej odpowiedzi, aby zająć się bardziej pragmatyczną perspektywą.
Kiedy nie należy dopuszczać, aby ustalony efekt zmieniał się na różnych poziomach efektu losowego?
Nie zajmę się problemami opisanymi już w innych odpowiedziach, zamiast tego odniosę się do znanego teraz, choć wolę powiedzieć „niesławny” artykuł Barr i in. (2013), często nazywany po prostu „Zachowaj maksimum”
Barr, DJ, Levy, R., Scheepers, C. and Tily, HJ, 2013. Struktura losowych efektów do testowania potwierdzających hipotez: Utrzymuj wartość maksymalną. Journal of memory and language, 68 (3), s. 255–278.
W tym artykule autorzy twierdzą, że wszystkie ustalone efekty powinny się różnić w zależności od poziomów czynników grupujących (przechwytywanie losowe). Ich argument jest dość przekonujący - w zasadzie, że nie pozwalając im się zmieniać, nakłada ograniczenia na model. Jest to dobrze opisane w innych odpowiedziach. Istnieją jednak potencjalnie poważne problemy z tym podejściem, które opisuje Bates el al (2015):
Bates, D., Kliegl, R., Vasishth, S. i Baayen, H., 2015. Parsimonious mieszane modele. nadruk arXiv arXiv: 1506.04967
Warto zauważyć, że Bates jest głównym autorem lme4
pakietu do dopasowywania modeli mieszanych w R, który jest prawdopodobnie najczęściej używanym pakietem dla takich modeli. Bates i wsp. Zauważają, że w wielu rzeczywistych aplikacjach dane po prostu nie będą obsługiwały maksymalnej struktury efektów losowych, często dlatego, że w każdej grupie nie ma wystarczającej liczby obserwacji dla odpowiednich zmiennych. Może się to objawiać w modelach, które nie są zbieżne lub występują w przypadkowych efektach. Świadczy o tym duża liczba pytań na tej stronie dotyczących takich modeli. Zauważają również, że Barr i wsp. Zastosowali stosunkowo prostą symulację, z „dobrze wychowanymi” losowymi efektami jako podstawą do opracowania. Zamiast tego Bates i wsp. Sugerują następujące podejście:
Zaproponowaliśmy (1) zastosowanie PCA do określenia wymiarowości macierzy wariancji-kowariancji struktury losowego efektu (2), aby początkowo ograniczyć parametry korelacji do zera, zwłaszcza gdy początkowa próba dopasowania modelu maksymalnego nie jest zbieżna, oraz (3) w celu usunięcia nieistotnych składników wariancji i powiązanych parametrów korelacji z modelu
W tym samym artykule zauważają również:
Co ważne, brak zbieżności nie wynika z wad algorytmu szacowania, ale jest bezpośrednią konsekwencją próby dopasowania modelu, który jest zbyt złożony, aby mógł być odpowiednio obsługiwany przez dane.
I:
maksymalne modele nie są konieczne do ochrony przed wnioskami antykonserwatywnymi. Ochronę tę zapewniają w pełni kompleksowe modele oparte na realistycznych oczekiwaniach co do złożoności danych. W statystyce, podobnie jak w innych dziedzinach nauki, parsymonia jest cnotą, a nie wadą.
Bates i in. (2015)
Z bardziej stosowanej perspektywy należy również rozważyć, czy proces generowania danych, biologiczna / fizyczna / chemiczna teoria leżąca u podstaw danych, powinien prowadzić analityka w kierunku określenia struktury efektów losowych.