Po pierwsze przedstawię czwarty model dyskusji w mojej odpowiedzi:
fit1,5 <- lm (r_2 ~ x_1 + x_2 + y_1)
Część 0
Różnicę między fit1 a fit1,5 najlepiej podsumować jako różnicę między ograniczoną różnicą a optymalną różnicą.
Użyję prostszego przykładu, aby to wyjaśnić niż ten podany powyżej. Zacznijmy od fit1.5. Prostsza wersja modelu to
Oczywiście, gdy otrzymamy oszacowanie OLS, znajdzie on „optymalny” wybór dla . I choć wydaje się to dziwne, pisanie jest takie, możemy przepisać formułę jako
Możemy to jako „optymalną” różnicę między dwiema zmiennymi .b 2 y 2 - b 2 · y 1 = b 0 + b 1 · x y
y2=b0+b1⋅x+b2⋅y1
b2y2−b2⋅y1=b0+b1⋅x
y
Teraz, jeśli zdecydujemy się na ograniczenie , wówczas formuła / model stanie się
co jest tylko (ograniczoną) różnicą.b2=1
y2−y1=b0+b1⋅x
Zauważ, że w powyższej demonstracji, jeśli pozwolisz być zmienną dychotomiczną, a będzie testem wstępnym, a parowaniem wyniku po teście, to model ograniczonej różnicy byłby tylko niezależnymi próbkami - test na zwiększenie wyników , podczas gdy optymalnym modelem różnic byłby test ANCOVA z wynikami przedtestowymi stosowanymi jako zmienne towarzyszące.xy1y2t
Część 1
Model fit2 najlepiej przemyśleć w podobny sposób, jak w przypadku podejścia różnicowego zastosowanego powyżej. Chociaż jest to nadmierne uproszczenie (ponieważ celowo terminy błędów), model można przedstawić jako
gdzie dla wartości dla wartości . Oto uproszczenie ...
Napisano w inny sposób, . Podczas gdy model fit1.5 miał wartość jako wartość optymalną dla analizy OLS, tutaj
y=b0+b1⋅x+b2⋅t
t=0y1t=1y2 r2-y1=b2b2b2ry1y2=b0+b1⋅x=b0+b1⋅x+b2
y2−y1=b2b2b2jest zasadniczo tylko średnią różnicą między wartościami (po skontrolowaniu innych zmiennych towarzyszących).
y
Część 2
Więc jaka jest różnica między modelami fit2 i fit3 ... właściwie bardzo niewiele. Model fit3 uwzględnia korelację pod względem błędów, ale to tylko zmienia proces estymacji, a zatem różnice między dwoma wyjściami modelu będą minimalne (poza faktem, że fit3 szacuje czynnik autoregresyjny).
Część 2.5
I do tej dyskusji dołączę jeszcze jeden model
fit4 <- lmer (y ~ czas + x1 + x2 + (1 | id), dane = df. długi)
Ten model z mieszanymi efektami robi nieco inną wersję podejścia autoregresyjnego. Gdybyśmy mieli uwzględnić współczynnik czasu w efektach losowych, byłoby to porównywalne do obliczenia różnicy między dla każdego pacjenta. (Ale to nie zadziała ... i model nie będzie działać.)y
Holland, Paul & Donald Rubin. 1983. On Lord’s Paradox. In Principles of modern psychological measurement: A festchrift for Frederic M. Lord edited by Wainer, Howard & Samuel Messick pgs:3-25. Lawrence Erlbaum Associates. Hillsdale, NJ.