Aby odpowiedzieć na twoje dosłowne pytanie: „Czy prawidłowe jest uwzględnienie miary odniesienia jako zmiennej kontrolnej podczas testowania wpływu zmiennej niezależnej na wyniki zmian?”, Odpowiedź brzmi „ nie” . Odpowiedź brzmi „nie”, ponieważ poprzez konstrukcję wynik wyjściowy jest skorelowany ze składnikiem błędu, gdy wynik zmiany jest stosowany jako zmienna zależna, stąd oszacowany wpływ wartości wyjściowej na wynik zmiany jest nie do interpretacji.
Za pomocą
- jako masa początkowaY1
- jako masa końcowaY2)
- jako zmiana masy (tj. Δ Y = Y 2 - Y 1 )Δ YΔ Y= Y2)- Y1
- jakolosowo przypisanyzabieg, orazT.
- jako inne czynniki egzogenne wpływające na wagę (np. Inne zmienne kontrolne, które są związane z wynikiem, ale powinny być nieskorelowane z leczeniem z powodu losowego przypisania)X
Jeden ma model regresji na T i X ;Δ YT.X
Δ Y= β1T.+ β2)X+ e
Który z definicji jest równoważny;
Y2)- Y1= β1T.+ β2)X+e
Teraz, jeśli uwzględnisz linię bazową jako zmienną towarzyszącą, powinieneś zobaczyć problem, polegający na tym, że masz człon po obu stronach równania. To pokazuje, że β 3 Y 1 jest nie do zinterpretowania, ponieważ jest z natury skorelowany ze składnikiem błędu.Y1β3)Y1
Y2)-Y1Y2)=β1T.+β2)X+ β3)Y1+ e= β1T.+ β2)X+ β3)Y1+ ( e + Y1)
Teraz część zamieszania w różnych odpowiedziach wydaje się wynikać z faktu, że różne modele przyniosą identyczne wyniki dla efektu leczenia , w moim powyższym sformułowaniu. Tak więc, gdyby porównać efekt leczenia dla modelu, stosując wyniki zmian jako zmienną zależną do modelu wykorzystującego „poziomy” (z każdym modelem zawierającym linię bazową Y 1 jako zmienną towarzyszącą), interpretacja efektu leczenia byłaby to samo. W dwóch kolejnych modelach β 1 T będzie taki sam, podobnie jak wnioski oparte na nich (Bruce Weaver opublikował kod SPSS wykazujący również równoważność).β1T.Y1β1T.
doh a n ge S. c o r e M o de lL e v e l s M o de l: Y2)- Y1= β1T.+ β2)X+ β3)Y1+ e: Y2)= β1T.+ β2)X+ β3)Y1+ e
Więc niektórzy będą się kłócić (jak Felix ma w tym wątku i jak Bruce Weaver w niektórych dyskusjach na temat grupy dyskusyjnej SPSS), ponieważ ponieważ modele dają taki sam szacowany efekt leczenia, nie ma znaczenia, który wybierzesz. Nie zgadzam się, ponieważ nie można zinterpretować wyjściowej zmiennej towarzyszącej w modelu wyniku zmiany, nigdy nie należy włączać linii bazowej jako zmiennej dodatkowej (niezależnie od tego, czy szacowany efekt leczenia jest taki sam, czy nie). Pojawia się zatem kolejne pytanie, jaki jest sens stosowania wyników zmian jako zmiennych zależnych? Jak już zauważył Felix, model wykorzystujący wynik zmiany jako zmienną zależną, z wyłączeniem linii podstawowej jako współzmiennej, jest inny niż model wykorzystujący poziomy. Aby wyjaśnić, kolejne modele dadzą różne efekty leczenia (szczególnie w przypadku, gdy leczenie jest skorelowane z linią podstawową);
doh a n ge S. c o r e M o de l W. i t h o u t B a s e l i n e L e v e l s M o de l: Y2)- Y1= β1T.+ β2)X+ e: Y2)= β1T.+ β2)X+ β3)Y1+ e
Zostało to odnotowane w poprzedniej literaturze jako „Paradoks Pana”. Który model ma rację? Cóż, w przypadku eksperymentów randomizowanych powiedziałbym, że preferowany jest model Poziomy (chociaż jeśli wykonałeś dobrą robotę losowo, średni efekt leczenia powinien być bardzo zbliżony między modelami). Inni zauważyli powody, dla których preferowany jest model poziomów, odpowiedź Charliego ma sens, ponieważ można oszacować efekty interakcji z linią bazową w modelu poziomów (ale nie można tego zrobić w modelu oceny zmian). Whuber w tej odpowiedzi na bardzo podobne pytanie pokazuje, w jaki sposób wyniki zmian indukują korelacje między różnymi metodami leczenia.
W sytuacjach, w których leczenie nie jest losowo przypisywane, model wykorzystujący wyniki zmian jako zmienną zależną powinien zostać bardziej szczegółowo rozważony. Główną zaletą modelu oceny zmian jest to, że kontrolowane są zawsze niezmienne predyktory wyniku. Powiedzmy w powyższym sformułowaniu, że jest stały w czasie (na przykład powiedz, że predyspozycje genetyczne mają określoną wagę) i że X jest skorelowany z tym, czy dana osoba decyduje się na ćwiczenie (a X nie jest obserwowany). W takim przypadku preferowany jest model oceny zmian. Również w przypadkach, w których wybór do leczenia jest skorelowany z wartością wyjściową, model oceny zmian może być preferowany. Paul Allison w swoim artykule,XXXZmień wyniki jako zmienne zależne w analizie regresji , podaje te same przykłady (i w dużej mierze wpłynęło na moją perspektywę na ten temat, więc gorąco sugeruję, aby ją przeczytać).
Nie oznacza to, że wyniki zmian są zawsze lepsze w przypadku ustawień nierandomizowanych. W przypadku, gdy spodziewasz się, że poziom wyjściowy będzie miał rzeczywisty wpływ przyczynowy na wagę postu, powinieneś użyć modelu poziomów. W przypadku, gdy oczekuje się, że poziom wyjściowy będzie miał przyczynowo-skutkowy wpływ, a wybór leczenia jest skorelowany z poziomem wyjściowym, efekt leczenia jest mylony z efektem wyjściowym.
Zignorowałem notatkę Charliego, że logarytm wagi może być użyty jako zmienna zależna. Chociaż nie wątpię, że może to być możliwa, to w pewnym stopniu nie jest to sekwencyjne pytanie wstępne. Kolejne pytanie dotyczyło tego, kiedy należy zastosować logarytmy zmiennej (i te nadal obowiązują w tym przypadku). Prawdopodobnie istnieje wcześniejsza literatura na ten temat, która pomogłaby ci ustalić, czy stosowanie zarejestrowanej masy ciała jest również odpowiednie.
Cytat
Allison, Paul D. 1990. Zmień wyniki jako zmienne zależne w analizie regresji . Metodologia socjologiczna 20: 93-114. Publiczna wersja PDF .