Pojedyncze macierze kowariancji efektu losowego
Uzyskanie oszacowania korelacji efektu losowego +1 lub -1 oznacza, że algorytm optymalizacyjny uderzył „granicę”: korelacje nie mogą być wyższe niż +1 ani niższe niż -1. Nawet jeśli nie ma wyraźnych błędów lub ostrzeżeń o konwergencji, może to potencjalnie wskazywać na pewne problemy z konwergencją, ponieważ nie oczekujemy, że prawdziwe zależności leżą na granicy. Jak powiedziałeś, zwykle oznacza to, że nie ma wystarczających danych, aby wiarygodnie oszacować wszystkie parametry. Matuschek i in. 2017 twierdzą, że w tej sytuacji moc może zostać zagrożona.
Innym sposobem na przekroczenie granicy jest oszacowanie wariancji na 0: Dlaczego otrzymuję zerową wariancję losowego efektu w moim modelu mieszanym, pomimo pewnych różnic w danych?
Obie sytuacje mogą być postrzegane jako uzyskiwanie zdegenerowanej macierzy kowariancji efektów losowych (w twoim przykładzie wyjściowa macierz kowariancji wynosi ); zerowa wariancja lub idealna korelacja oznacza, że macierz kowariancji nie ma pełnej rangi, a [przynajmniej] jedna z jej wartości własnych wynosi zero. Ta obserwacja natychmiast sugeruje, że istnieją inne , bardziej złożone sposoby uzyskania zdegenerowanej macierzy kowariancji: można mieć macierz kowariancji bez zer i zerowych korelacji, ale mimo to z niedoborem rang (liczba pojedyncza). Bates i in. Parsimonious Mixed Models 20154×44×4(nieopublikowany przedruk) zaleca użycie analizy głównego składnika (PCA), aby sprawdzić, czy uzyskana macierz kowariancji jest pojedyncza. Jeśli tak, sugerują potraktowanie tej sytuacji w taki sam sposób, jak powyższe sytuacje pojedyncze.
Co więc zrobić?
Jeśli nie ma wystarczających danych do wiarygodnego oszacowania wszystkich parametrów modelu, powinniśmy rozważyć uproszczenie modelu. Biorąc przykładowy model, X*Cond + (X*Cond|subj)
istnieją różne możliwe sposoby jego uproszczenia:
Usuń jeden z efektów losowych, zwykle korelację najwyższego rzędu:
X*Cond + (X+Cond|subj)
Pozbądź się wszystkich parametrów korelacji:
X*Cond + (X*Cond||subj)
Aktualizacja: jak zauważa @Henrik, ||
składnia usunie korelacje tylko wtedy, gdy wszystkie zmienne po lewej stronie są liczbowe. Jeśli w grę Cond
wchodzą zmienne jakościowe (takie jak ), należy raczej użyć jego wygodnego afex
pakietu (lub uciążliwych obejść ręcznych). Zobacz jego odpowiedź, aby uzyskać więcej informacji.
Pozbądź się niektórych parametrów korelacji, dzieląc ten termin na kilka, np .:
X*Cond + (X+Cond|subj) + (0+X:Cond|subj)
- Ogranicz macierz kowariancji w określony sposób, np. Ustawiając jedną konkretną korelację (tę, która osiągnęła granicę) na zero, jak sugerujesz. Nie ma wbudowanego sposobu
lme4
na osiągnięcie tego. Zobacz odpowiedź @ BenBolkera na temat SO, aby zobaczyć, jak to osiągnąć poprzez inteligentne hakowanie.
Wbrew temu, co powiedziałeś, nie sądzę, że Matuschek i in. 2017 szczególnie polecam # 4. Istota Matuschek i in. 2017 oraz Bates i in. Wydaje się, że rok 2015 zaczyna się od maksymalnego modelu a la Barr i in. 2013, a następnie zmniejsza złożoność, aż macierz kowariancji osiągnie pełną rangę. (Co więcej, często zalecają jeszcze bardziej zmniejszenie złożoności, aby zwiększyć moc.) Aktualizacja: W przeciwieństwie do tego, Barr i in. zaleca się zmniejszenie złożoności WYŁĄCZNIE, jeśli model nie jest zbieżny; są gotowi tolerować pojedyncze macierze kowariancji. Zobacz odpowiedź @ Henrika.
Jeśli ktoś zgadza się z Bates / Matuschek, to uważam, że dobrze jest wypróbować różne sposoby zmniejszenia złożoności, aby znaleźć ten, który wykona zadanie, wyrządzając jednocześnie „najmniej obrażeń”. Patrząc na moją listę powyżej, pierwotna macierz kowariancji ma 10 parametrów; # 1 ma 6 parametrów, # 2 ma 4 parametry, # 3 ma 7 parametrów. Który model pozbyje się idealnych korelacji, nie można powiedzieć bez ich dopasowania.
Ale co jeśli jesteś zainteresowany tym parametrem?
Powyższa dyskusja traktuje macierz kowariancji efektu losowego jako parametr uciążliwy. Zadajesz interesujące pytanie, co zrobić, jeśli jesteś szczególnie zainteresowany parametrem korelacji, który musisz „zrezygnować”, aby uzyskać sensowne rozwiązanie pełnej rangi.
Zauważ, że ustawienie parametru korelacji na zero niekoniecznie da BLUP ( ranef
), które są nieskorelowane; w rzeczywistości mogą one nawet nie mieć tak dużego wpływu ( demonstracja znajduje się w odpowiedzi na @ Placidia ). Tak więc jedną opcją byłoby przyjrzenie się korelacjom BLUP i zgłoszenie tego.
Inną, być może mniej atrakcyjną opcją byłoby zastosowanie traktowania subject
jako stałego efektu Y~X*cond*subj
, uzyskanie szacunków dla każdego pacjenta i obliczenie korelacji między nimi. Jest to równoważne z uruchomieniem osobnych Y~X*cond
regresji dla każdego podmiotu osobno i uzyskanie od nich oszacowań korelacji.
Zobacz także sekcję dotyczącą pojedynczych modeli w często zadawanych pytaniach dotyczących modelu mieszanego Bena Bolkera:
Bardzo często w przypadku zbyt wielu modeli mieszanych powstają pojedyncze dopasowania. Technicznie, osobliwość oznacza, że niektóre parametry (rozkład wariancji Choleskiego-kowariancji) odpowiadające elementom diagonalnym współczynnika Choleskiego są dokładnie zerowe, co stanowi krawędź możliwej przestrzeni, lub równoważnie, że macierz wariancji-kowariancji ma jakieś zero wartości własne (tj. jest dodatnim półfinałem raczej niż dodatnim określonym) lub (prawie równoważnie), że niektóre wariancje są szacowane na zero lub niektóre korelacje są szacowane na +/- 1.θ