Kiedy teoretycznie brzmią modele mieszane z zerową korelacją?


25

Cytat blokowy poniżej, od liderów w dziedzinie modelowania efektów mieszanych, twierdzi, że koordynacja przesunięć w modelach z zerową korelacją między efektami losowymi (modele „ZCP”) zmienia prognozy modeli. Ale czy ktoś może rozwinąć lub uzasadnić swoje roszczenia?

Sprawozdania te zostały wydane z Bates wsp za 2015 na papierze lme4, Montaż liniowe modele mieszane efekty Korzystanie lme4 , strona 7 akapit drugi ( link do pobrania ).

Oto parafraza tego, co napisali:

Chociaż modele parametrów zerowej korelacji są stosowane w celu zmniejszenia złożoności modeli o losowych nachyleniach, mają one jedną wadę. Modele, w których nachylenia i punkty przecięcia mogą mieć niezerową korelację, są niezmienne dla addytywnych przesunięć predyktora ciągłego.

Ta niezmienność załamuje się, gdy korelacja jest ograniczona do zera; każda zmiana predyktora z konieczności doprowadzi do zmiany szacowanej korelacji oraz prawdopodobieństwa i prognoz modelu. 1 Na przykład możemy wyeliminować korelację w fm1, po prostu przesuwając Dni [predyktor towarzyszący slope ] o kwotę równą stosunkowi szacowanych odchyleń standardowych między podmiotami pomnożonemu przez szacowaną korelację, tj. 2 ,

ρslope:intercept×σslopeσintercept

Zastosowanie takich modeli powinno być idealnie ograniczone do przypadków, w których predyktor jest mierzony na skali współczynnika (tj. Punkt zerowy na skali jest znaczący, a nie tylko lokalizacja określona przez wygodę lub konwencję).

Pytania:

Numerowane zgodnie z powyższymi indeksami górnymi ...

  1. Widzę, że każde przesunięcie w układzie współrzędnych, za pomocą którego mierzony jest predyktor, doprowadzi do zmiany szacowanej korelacji, prowadząc w ten sposób do korelacji niezerowej. Potwierdza to stwierdzenie, że modele parametrów zerowej korelacji nie są niezmienne przy przesunięciach w układach współrzędnych predyktora, a zatem każdy model z niezerowymi korelacjami efektów losowych można przekształcić w model z zerowymi korelacjami poprzez odpowiednie przesunięcie współrzędnych. Myślę, że obsługuje również trzeci akapit w powyższej parafrazie: modele ZCP (i modele przechwytujące zero - patrz poniżej; ale proszę sprawdź to ) są ważne tylko dla modeli wykorzystujących określone, specjalne układy współrzędnych. Ale dlaczego przewidywania przesunięcia współrzędnych powinny zmieniać prognozy dla takich modeli?

    Na przykład przesunięcie współrzędnych spowoduje również zmianę terminu przechwytywania o ustalonym efekcie dla średnich grupowych (patrz poniżej), ale tylko o kwotę odpowiednią do zmiany początku układu współrzędnych predyktora. Taka zmiana nie ma wpływu na przewidywania modelu, o ile nowy układ współrzędnych jest używany dla przesuniętego predyktora.

    W celu rozwinięcia, jeśli nachylenie ustalonego efektu związane z przesuniętym predyktorem jest dodatnie, a początek układu współrzędnych predyktora jest przesunięty w kierunku ujemnym, wówczas punkt przecięcia o stałym efekcie zmniejszy się, a wszelkie powiązane punkty przechwytywania efektu losowego również się zmienią odpowiednio, odzwierciedlając nową definicję „początku” (a zatem przechwytywania) w przesuniętym układzie współrzędnych. Nawiasem mówiąc, myślę, że to rozumowanie sugeruje również, że model przechwytywania zerowego również nie jest niezmienny przy takich zmianach.

  1. Myślę, że mam rozsądny sposób na rozwiązanie tego problemu, ale otrzymałem odpowiedź nieco inną niż Bates i in. Czy gdzieś się mylę?

    Poniżej moja odpowiedź. Poniżej znajduje się opis tego, jak doszedłem do mojego wyniku. Podsumowując, stwierdzam, że jeśli przesunę początek ujemnie o , tak że w nowym układzie współrzędnych predyktor przyjmuje wartości , wówczas korelacja w nowym układzie współrzędnych wynosi zero, jeżeli:δ > 0 x = x + δ ρ xδ>0x=x+δρ

    δ=ρslope:intercept×σinterceptσslope

    Różni się to od wyniku Batesa i in .


Opis mojej metody (czytanie opcjonalne) : Powiedzmy, że mamy korelację dwóch efektów losowych, i ( w skrócie), oba odpowiadające temu samemu współczynnikowi grupowania z poziomami (ponumerowanymi przez , w zakresie od do ). Powiedzmy również, że ciągły predyktor, z którym sparowany jest losowy nazywa się , zdefiniowany w taki sposób, że iloczyn generuje warunkowy wkład w dopasowaną wartość dla poziomuprzechwytujący Int k i 1 k nachylenie x x x nachylenie i y ö B S I ρ x nachylenieslopeinterceptintki1kslopexx×slopeiy^obsipowiązanego czynnika grupującego. Chociaż w rzeczywistości algorytm MLE określa wartość celu zmaksymalizowania prawdopodobieństwa , oczekiwałbym, że poniższe wyrażenie powinno być wymiarowo poprawnym sposobem określania efektów jednolitego tłumaczenia w , mnożnika losowego efektu dla .ρxslope

ρslope:int=Ei[(slopeislopei¯)(intiinti¯)]Ei[(slopeislopei¯)2]Ei[(intiinti¯)2]

Aby dojść do mojego wyniku, najpierw przepisałem starą wartość punktu przecięcia pod względem nowej wartości punktu przecięcia, (tutaj, , w lewo „przesunięcie pochodzenia dla predyktora ). Następnie podstawiłem wynikowe wyrażenie do licznika powyższej formuły dla , obliczając wartość która spowodowała zerową kowariancję w nowym układzie współrzędnych. Należy zauważyć, że jak stwierdzono w pytaniu 1 powyżej, pojęcie przechwytywania o stałym skutku również zmieni się w analogiczny sposób: . (Tutaj,δ > 0 x ρ δ β 0 = - δ × β x + β 0 β x x .int=δ×slope+intδ>0xρδβ0=δ×βx+β0βxjest predyktorem o stałym efekcie powiązanym z predyktorem przesuniętym)x.


1
Kilka szorstkich pomysłów. zmienia się, jeśli (1) zmienia się ustalone nachylenie lub (2) zmienia się losowe nachylenie. Dla (1): ustalone nachylenie można postrzegać jako średnią ważoną nachyleń charakterystycznych dla klastra, gdzie ciężar zależy częściowo od szacowanych składników wariancji. Pominięcie kowariancji zmienia var. szacunki, zmiana wag, zmiana stałego nachylenia. Dla (2): losowe zbocza są zboczami charakterystycznymi dla skupisk „skurczonymi” w kierunku stałego zbocza proporcjonalnie do tych samych wag. Pominięcie kowariancji zmienia var. szacunki, zmiana stopnia skurczu, zmiana losowych nachyleń. y^
Jake Westfall,

Jestem trochę rozczarowany, że nie zwrócił na to większej uwagi, @clarpaul. Możesz po prostu podać własną odpowiedź. Jeśli nikt nie odpowie, po prostu dam ci nagrodę.
Gung - Przywróć Monikę

Dzięki @gung, moja odpowiedź byłaby ściśle dopasowana do moich „Edycji” powyżej. Nagroda byłaby miła, ale mogę nie mieć czasu, zanim wygaśnie. Zachęcam wszystkich do wzięcia moich „Edycji” i przekształcenia ich w odpowiedzi, jeśli zgadzają się z podstawowym uzasadnieniem i są gotowi poświęcić trochę czasu na ich dopracowanie.
clarpaul 14.04.16

Odpowiedzi:


4
  1. Odpowiedź na to pytanie okazuje się raczej definicyjna . Gdyby przesunąć współrzędne zmiennych niezależnych modelu ZCP i pozwolić, aby korelacje rozwijały się w nieograniczony sposób , przewidywania nie zmieniłyby się, ponieważ liniowe modele efektów mieszanych z nieograniczonymi korelacjami niezmienne w tłumaczeniu (można to pokazać odrobiną matematyki) . Ale z definicji model ZCP ma korelacje ograniczone do . W przypadku przesunięcia współrzędnych korelacje nie byłyby rozwijane zgodnie z wymogami w nieograniczonym modelu LME. Dlatego modele ZCP nie są niezmienne w tłumaczeniu, a przesunięcie współrzędnych byłoby0zmienić prognozy modelu. I (jeśli oczekujesz, że modele LME będą niezmienne w tłumaczeniu na rozsądne przesunięcia współrzędnych) tylko modele, w których takie przesunięcia współrzędnych nie mają sensu, są teoretycznie sensowne jako modele ZCP (tj. „Specjalne” wymienione w trzecim akapicie parafrazy od Bates i wsp powyżej). [Uwaga: upiększę tę odpowiedź w przyszłości, aby uwzględnić formuły, które wyprowadziłem dla korelacji, która rozwija się podczas przesuwania współrzędnych początkowo modelu ZCP, oraz dla dowodu, że modele LME z nieograniczonymi korelacjami są niezmienne w tłumaczeniu.]
  2. Wynik Batesa i in. Jest po prostu literówką. Odpowiedź musi mieć takie same wymiary jak predyktor ( dni ), który jest przesunięty. Ponieważ wlog, i można uznać za posiadające wymiary jedności, , które ma wymiary (takie same wymiary jak ), musi być w mianowniku, aby aby mieć prawidłowe wymiary.x σ i n t e r c e p t ρ σ s l o p e 1 / x s l o p e δδxσinterceptρσslope1/xslopeδ
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.