Czy prawidłowe jest uwzględnienie miary wyjściowej jako zmiennej kontrolnej podczas testowania wpływu zmiennej niezależnej na wyniki zmian?


38

Próbuję uruchomić regresję OLS:

  • DV: Zmiana masy ciała w ciągu roku (waga początkowa - waga końcowa)

  • IV: Czy ćwiczysz czy nie.

Wydaje się jednak rozsądne, że cięższe osoby będą tracić więcej masy na jednostkę ćwiczeń niż osoby szczuplejsze. Dlatego chciałem dołączyć zmienną kontrolną:

  • CV: początkowa waga początkowa.

Jednak teraz początkowa waga jest używana ZARÓWNO do obliczenia zmiennej zależnej ORAZ jako zmiennej kontrolnej.

Czy to w porządku? Czy to narusza założenie OLS?


4
Czy leczenie przydzielono losowo?
Andy W

1
Zauważ, że ostatnio zapytano również o inny bardzo podobny, stats.stackexchange.com/q/15104/1036 . Odpowiedź na to pytanie ma zastosowanie do tego pytania (w rzeczywistości powiedziałbym, że są to pytania podwójne).
Andy W

3
@Andy Rzeczywiście, dwa pytania są na tyle różne, że udzieliłbym innej odpowiedzi na jedno z nich niż na drugie. Charlie już tutaj przedstawił miłą analizę.
whuber

3
Należy pamiętać, że stosowanie wyników różnic zwykle wiąże się ze znacznym zmniejszeniem niezawodności, chociaż jest to nieco dyskutowane
Behacad

Odpowiedzi:


25

Aby odpowiedzieć na twoje dosłowne pytanie: „Czy prawidłowe jest uwzględnienie miary odniesienia jako zmiennej kontrolnej podczas testowania wpływu zmiennej niezależnej na wyniki zmian?”, Odpowiedź brzmi „ nie” . Odpowiedź brzmi „nie”, ponieważ poprzez konstrukcję wynik wyjściowy jest skorelowany ze składnikiem błędu, gdy wynik zmiany jest stosowany jako zmienna zależna, stąd oszacowany wpływ wartości wyjściowej na wynik zmiany jest nie do interpretacji.

Za pomocą

  • jako masa początkowaY1
  • jako masa końcowaY2
  • jako zmiana masy (tj. Δ Y = Y 2 - Y 1 )ΔYΔY=Y2Y1
  • jakolosowo przypisanyzabieg, orazT
  • jako inne czynniki egzogenne wpływające na wagę (np. Inne zmienne kontrolne, które są związane z wynikiem, ale powinny być nieskorelowane z leczeniem z powodu losowego przypisania)X

Jeden ma model regresji na T i X ;ΔYTX

ΔY=β1T+β2X+e

Który z definicji jest równoważny;

Y2Y1=β1T+β2X+e

Teraz, jeśli uwzględnisz linię bazową jako zmienną towarzyszącą, powinieneś zobaczyć problem, polegający na tym, że masz człon po obu stronach równania. To pokazuje, że β 3 Y 1 jest nie do zinterpretowania, ponieważ jest z natury skorelowany ze składnikiem błędu.Y1β3Y1

Y2Y1=β1T+β2X+β3Y1+eY2=β1T+β2X+β3Y1+(e+Y1)

Teraz część zamieszania w różnych odpowiedziach wydaje się wynikać z faktu, że różne modele przyniosą identyczne wyniki dla efektu leczenia , w moim powyższym sformułowaniu. Tak więc, gdyby porównać efekt leczenia dla modelu, stosując wyniki zmian jako zmienną zależną do modelu wykorzystującego „poziomy” (z każdym modelem zawierającym linię bazową Y 1 jako zmienną towarzyszącą), interpretacja efektu leczenia byłaby to samo. W dwóch kolejnych modelach β 1 T będzie taki sam, podobnie jak wnioski oparte na nich (Bruce Weaver opublikował kod SPSS wykazujący również równoważność).β1TY1β1T

Change Score Model:Y2Y1=β1T+β2X+β3Y1+eLevels Model:Y2=β1T+β2X+β3Y1+e

Więc niektórzy będą się kłócić (jak Felix ma w tym wątku i jak Bruce Weaver w niektórych dyskusjach na temat grupy dyskusyjnej SPSS), ponieważ ponieważ modele dają taki sam szacowany efekt leczenia, nie ma znaczenia, który wybierzesz. Nie zgadzam się, ponieważ nie można zinterpretować wyjściowej zmiennej towarzyszącej w modelu wyniku zmiany, nigdy nie należy włączać linii bazowej jako zmiennej dodatkowej (niezależnie od tego, czy szacowany efekt leczenia jest taki sam, czy nie). Pojawia się zatem kolejne pytanie, jaki jest sens stosowania wyników zmian jako zmiennych zależnych? Jak już zauważył Felix, model wykorzystujący wynik zmiany jako zmienną zależną, z wyłączeniem linii podstawowej jako współzmiennej, jest inny niż model wykorzystujący poziomy. Aby wyjaśnić, kolejne modele dadzą różne efekty leczenia (szczególnie w przypadku, gdy leczenie jest skorelowane z linią podstawową);

Change Score Model Without Baseline:Y2Y1=β1T+β2X+eLevels Model:Y2=β1T+β2X+β3Y1+e

Zostało to odnotowane w poprzedniej literaturze jako „Paradoks Pana”. Który model ma rację? Cóż, w przypadku eksperymentów randomizowanych powiedziałbym, że preferowany jest model Poziomy (chociaż jeśli wykonałeś dobrą robotę losowo, średni efekt leczenia powinien być bardzo zbliżony między modelami). Inni zauważyli powody, dla których preferowany jest model poziomów, odpowiedź Charliego ma sens, ponieważ można oszacować efekty interakcji z linią bazową w modelu poziomów (ale nie można tego zrobić w modelu oceny zmian). Whuber w tej odpowiedzi na bardzo podobne pytanie pokazuje, w jaki sposób wyniki zmian indukują korelacje między różnymi metodami leczenia.

W sytuacjach, w których leczenie nie jest losowo przypisywane, model wykorzystujący wyniki zmian jako zmienną zależną powinien zostać bardziej szczegółowo rozważony. Główną zaletą modelu oceny zmian jest to, że kontrolowane są zawsze niezmienne predyktory wyniku. Powiedzmy w powyższym sformułowaniu, że jest stały w czasie (na przykład powiedz, że predyspozycje genetyczne mają określoną wagę) i że X jest skorelowany z tym, czy dana osoba decyduje się na ćwiczenie (a X nie jest obserwowany). W takim przypadku preferowany jest model oceny zmian. Również w przypadkach, w których wybór do leczenia jest skorelowany z wartością wyjściową, model oceny zmian może być preferowany. Paul Allison w swoim artykule,XXXZmień wyniki jako zmienne zależne w analizie regresji , podaje te same przykłady (i w dużej mierze wpłynęło na moją perspektywę na ten temat, więc gorąco sugeruję, aby ją przeczytać).

Nie oznacza to, że wyniki zmian są zawsze lepsze w przypadku ustawień nierandomizowanych. W przypadku, gdy spodziewasz się, że poziom wyjściowy będzie miał rzeczywisty wpływ przyczynowy na wagę postu, powinieneś użyć modelu poziomów. W przypadku, gdy oczekuje się, że poziom wyjściowy będzie miał przyczynowo-skutkowy wpływ, a wybór leczenia jest skorelowany z poziomem wyjściowym, efekt leczenia jest mylony z efektem wyjściowym.

Zignorowałem notatkę Charliego, że logarytm wagi może być użyty jako zmienna zależna. Chociaż nie wątpię, że może to być możliwa, to w pewnym stopniu nie jest to sekwencyjne pytanie wstępne. Kolejne pytanie dotyczyło tego, kiedy należy zastosować logarytmy zmiennej (i te nadal obowiązują w tym przypadku). Prawdopodobnie istnieje wcześniejsza literatura na ten temat, która pomogłaby ci ustalić, czy stosowanie zarejestrowanej masy ciała jest również odpowiednie.


Cytat

Allison, Paul D. 1990. Zmień wyniki jako zmienne zależne w analizie regresji . Metodologia socjologiczna 20: 93-114. Publiczna wersja PDF .


3
Y2=β1T+β2X+β3Y1+(e+Y1)Y1e+Y1Y1(Y1,Y2)Y1Y1

1
Y1Y1Y2Y1Y2

1
Y1β1

1
B1

1
pomiar jako odpowiedź i uwarunkowanie na ustaloną wartość wyjściową, a po drugie, że wariancja oszacowania punktowego z modelu ANCOVA jest zawsze większa lub równa tej z bezwarunkowej. Okazuje się, że ta różnica wariancji będzie zazwyczaj niewielka z powodu randomizacji, zapewniając, że wyjściowe średnie odpowiedzi między grupami są małe. Autorzy doszli do wniosku, że bezwarunkowy model jest odpowiedni do modelowania linii bazowej jako zmiennej losowej, ale ANCOVA jest odpowiednia, gdy jest postrzegana jako stała.
dandar

21

Odpowiedź Andy'ego wydaje się być poglądem ekonomisty na rzeczy. W badaniach klinicznych przyjęto, że prawie zawsze dostosowuje się do podstawowej wersji zmiennej odpowiedzi, aby znacznie zwiększyć moc. Ponieważ warunkujemy na podstawie zmiennych podstawowych, nie ma „terminu błędu”, aby można było je pomylić z ogólnym terminem błędu. Jedynym problemem byłoby, gdyby błędy pomiaru w kowariacie linii bazowej były pomylone z innym X, zniekształcając efekt tego drugiego X. Ogólnie preferowaną metodą jest dostosowanie wartości wyjściowej i modelowanie zmiennej odpowiedzi, nie obliczając zmiany. Jednym z powodów tego jest fakt, że zmiana jest silnie zależna od poprawności transformacji Y i że zmiana ta nie dotyczy ogólnie modeli regresji. Np. Jeśli Y jest porządkowe, różnica między dwiema zmiennymi porządkowymi nie jest już porządkowa.


1
Nie do końca rozumiem tę odpowiedź. Co masz na myśli mówiąc „dostosuj do linii bazowej”? Wziąć różnicę czy panować nad nią?
Henrik

3
Przez „dostosuj do linii podstawowej” miałem na myśli uwzględnienie linii bazowej jako współzmiennej. Często stosuje się również wyniki zmian, ale nie można ich używać bez dostosowania do linii bazowej jako współzmiennej (dlatego po co zawracać sobie głowę wynikami zmian?).
Frank Harrell,

6
Właściwie nic, co tu powiesz (lub w odpowiedzi na komentarze Felixa) bezpośrednio nie jest sprzeczne z tym, co mówię. Korzystanie z wyników zmian nie „dostosowuje się do wartości początkowej”, kontroluje za każdym razem niezmiennie odrzucone zmienne (lub jeśli wybór do leczenia jest wysoce skorelowany z linią podstawową). Jeśli poziom wyjściowy jest nie do pominięcia (tj. Ma bezpośredni wpływ przyczynowy na wynik lub ma interakcję z leczeniem), zmiana wyniku nie rozwiązuje problemu.
Andy W

2
@Frank Harrell Dziękujemy za dołączenie do dyskusji i wyjaśnienie tego. (+1)
Henrik

8

E[w1w0X,w0]=β0+xβ+w0γE[w1X,w0]=β0+xβ+w0(γ+1)

xw0w0

E[w1w0X,w0]=β0+(xw0)β+w0γ.

log(w1)log(w0)r;
rxpowiedziałby ci, w jaki sposób te predyktory są powiązane ze zmianami proporcji masy. To „kontroluje” wagę początkową, mówiąc, że na przykład reżim ćwiczeń, który zmniejsza wagę o 10% (współczynnik 0,1 pomnożony przez 100%) dla osoby, która waży 130 funtów, zmniejsza wagę o 13 funtów, podczas gdy program zmniejsza waga uczestnika o wadze 200 funtów o 20 funtów. W takim przypadku może nie być konieczne dołączenie początkowej masy (lub jej logu) po prawej stronie.

w0w0β1β1

log(w0)β1/w0

Jak widać, interakcje między stronami na temat warunków interakcji mogą być nieco trudne do interpretacji, ale mogą uchwycić interesujący cię wpływ.


Cześć Charlie, widzę zaletę zmiany proporcji, jednak dlaczego widzisz różnicę w rejestrowanych zmiennych w przeciwieństwie do zwykłego dzielenia w1 nad w0.
ChrisStata,

Podoba mi się pomysł proporcjonalnej zmiany. Pozostaje jednak pytanie, czy oczekiwana interakcja jest dosłownie proporcjonalna, czy nie. Jeśli nie, nadal musisz podać początkową wagę jako zmienną towarzyszącą. A może byłbyś pewien, że utrata 10% masy ciała dla osoby o wadze 100 lub 200 funtów jest taka sama?
Henrik

@ChrisStata, ty też możesz to zrobić. Jestem ekonomistą i uwielbiamy nasze logi (i również różnicowanie). Jeśli miałeś szereg czasowy (tj. Wiele obserwacji) dla każdej osoby (tworząc zestaw danych panelowych), mógłbym argumentować, że moja droga jest lepsza, ale to nie ma znaczenia tutaj. Henrik, masz rację; Dodałem trochę o tym do mojej odpowiedzi.
Charlie,

8

EDYCJA: Argument Andy'ego W przekonał mnie do upuszczenia Modelu C. Dodałem kolejną możliwość: Analizowanie zmian za pomocą modeli o losowym współczynniku (zwanych także modelami wielopoziomowymi lub modelami o mieszanym działaniu)

Odbyła się debata naukowa na temat korzystania z wyników różnic. Moje ulubione teksty to Rogosa (1982, [1]) i Fitzmaurice, Laird i Ware (2004, [2])

Ogólnie rzecz biorąc, masz trzy możliwości analizy swoich danych:

  • A) Weź tylko wynik różnicy międzyosobniczej (wynik zmiany)
  • B) Traktuj pomiar końcowy jak DV i kontroluj go dla linii podstawowej
  • C) Weź wynik różnicy jako DV i kontroluj go dla linii bazowej (to model, który zasugerowałeś). Z powodu argumentów Andy'ego W zrezygnowałem z tej alternatywy
  • D) Przy zastosowaniu podejścia wielopoziomowego / mieszanego efektu, w którym linia regresji jest modelowana dla każdego uczestnika, a uczestnik jest traktowany jako jednostka poziomu 2.

Modele A i B mogą dawać bardzo różne wyniki, jeśli poziom wyjściowy jest skorelowany z wynikiem zmiany (np. Cięższe osoby mają większą utratę masy ciała) i / lub przypisanie leczenia jest skorelowane z poziomem wyjściowym.

Jeśli chcesz dowiedzieć się więcej na temat tych problemów, zobacz cytowane artykuły lub tutaj i tutaj .

Niedawno przeprowadzono także badanie symulacyjne [3], które empirycznie porównuje warunki, w których preferowane są A lub B.

W przypadku całkowicie zbalansowanych projektów bez brakujących wartości model D powinien być równoważny z modelem A. Jednak zapewnia więcej informacji na temat zmienności między osobami, można go łatwo rozszerzyć na więcej punktów pomiarowych i ma ładne właściwości w obecności niezrównoważonych danych i / lub brakujące wartości.

Podsumowując: W twoim przypadku przeanalizowałbym pomiary kontrolowane dla linii bazowej (Model B).

[1] Rogosa, D., Brandt, D., i Zimowski, M. (1982). Podejście krzywej wzrostu do pomiaru zmiany. Psychological Bulletin, 92, 726-748.

[2] Fitzmaurice, GM, Laird, NM i Ware, JH (2004). Zastosowana analiza podłużna. Hoboken, NJ: Wiley.

[3] Petscher, Y., i Schatschneider, C., 2011. Badanie symulacyjne dotyczące wydajności prostych wyników z uwzględnieniem różnic i kowariancji w randomizowanych projektach eksperymentalnych. Journal of Educational Measurement, 48, 31-43.


Głosowałem za tą odpowiedzią w dół i możesz zobaczyć moją odpowiedź na pytanie, dlaczego uważam, że zmiana wyniku z wartością wyjściową jako współzmienną nie powinna zostać wykonana. Podsumowując, nawet jeśli Model B i C w twoim preparacie dają równoważne efekty leczenia, nie oznacza to, że Model C jest lepszy. W rzeczywistości efekt linii podstawowej w Modelu C jest niemożliwy do interpretacji, dlatego twierdzę, że nie należy go stosować.
Andy W

@AndyW: Twój argument mnie przekonał; chociaż najbardziej odpowiednie oszacowanie efektu leczenia jest takie samo w obu modelach, model B powinien być preferowany przed modelem C. Odpowiednio dostosowałem swoją odpowiedź. Ale co powiesz na to Laird, N. (1983). Further Comparative Analyses of Pretest-Posttest Research Designs. The American Statistician, 37, 329-330., kto wykazuje równoważność B i C?
Felix S

b¯b¯

Jeden punkt dla modelu D. Zastanawiam się, dlaczego nie brać pod uwagę tylko modelu D. Jest najbardziej spójny (wartość bazowa jest zmienną losową i nie musi być zmuszana do zmiennej zależnej), jest prosta, bardzo elastyczna (interakcja może być dodane) i zapewnia również standardowe odchylenie populacji.
giordano


3

Glymour i in. (2005) rozwiązany przy użyciu korekty linii bazowej podczas analizy wyniku zmiany. Jeśli zmiana stanu zdrowia poprzedza ocenę linii podstawowej lub występuje duży błąd pomiaru w zmiennej zależnej, stwierdzają, że może wystąpić błąd, jeśli model regresji wykorzystujący wynik zmiany jako zmienną zależną zawiera zmienną podstawową. Odpowiedź Franka Harrella: „Jedynym problemem byłoby, gdyby błędy pomiarowe w kowariacie linii bazowej były pomylone z innym X, zniekształcając efekt tego innego X”. może odzwierciedlać ten sam błąd co adresy Glymour.

Glymour (2005) „Kiedy dostosowanie linii podstawowej jest przydatne w analizie zmiany? Przykład edukacji i zmiany poznawczej. American Journal of Epidemiology 162: 267-278


1

Ocram jest nieprawidłowy. Różnica wag nie uwzględnia początkowej masy. W szczególności ciężar początkowy jest niejako wyjęty przez odjęcie od niego ciężaru końcowego.

Dlatego twierdzę, że nie narusza żadnych założeń, jeśli kontrolujesz początkową wagę.

(Ta sama logika obowiązuje, jeśli weźmiesz różnicę BMI i początkowego BMI.)


Aktualizacja
Po tym, jak krytyk Andy'ego W. pozwoli mi bardziej formalnie wyjaśnić, dlaczego mam rację, a Ocram się myli (przynajmniej z mojego punktu widzenia).

aw
iw=awew=aw+Δw

Δw=iwew=awaw+Δw=Δw

aw

Jeśli chcesz wziąć to pod uwagę, musisz uwzględnić go osobno w swoim modelu (jako zwykły parametr i / lub jako termin interakcji).

ΔBMJew=awpropΔw


Kiedy powiedziałem, że różnica bierze pod uwagę początkową wagę, właśnie to miałem na myśli. A konkretnie, co byś napisał? waga końcowa - waga początkowa = ...?
ocram

Jak napisałem, twoja argumentacja wydaje mi się fałszywa. Argumentowałbym, że w rzeczywistości waga końcowa bardziej uwzględnia wagę początkową, ponieważ jest na tej samej „skali”, podczas gdy różnicę „przeskalowuje się” (jako wagę końcową, stąd pewna wartość bezwzględna jest odejmowana od innej wartości absoulte .
Henrik

(-1) To nie jest poprawne. Zasadniczo nie należy umieszczać tej samej zmiennej po prawej i lewej stronie równania (ponieważ powoduje to, że zmienna niezależna jest skorelowana ze składnikiem błędu). Jeśli więc użyjesz różnic dla zmiennej zależnej, nie powinieneś uwzględniać linii bazowej jako współzmiennej.
Andy W

@Andy W: Wiem, że twój argument jest zasadniczo poprawny. Ale moim argumentem jest to, że częściowo odrzucasz wartość bezwzględną (odejmując wartość końcową od wartości bazowej), eliminując w ten sposób tę korelację. Dlatego dodanie go jako współzmiennej nie powoduje tego rodzaju fałszywej korelacji błędów.
Henrik,

@Henrik, zobacz moją odpowiedź na to pytanie i dlaczego nadal uważam, że ten sentyment jest błędny.
Andy W

0

Obseruj to

end weightinitial weightY=β0+βTx

jest równa

end weight=initial weight+β0+βTx

Innymi słowy, użycie zmiany masy (zamiast samej masy końcowej), ponieważ DV stanowi już ciężar początkowy.


1
Ale wydaje mi się, że może istnieć interakcja między początkową wagą a utratą masy ciała przy danym treningu. Powiedzmy, że osoba dorosła o wysokości 1,90 mi masie ciała 70 kg oraz osoba dorosła o wysokości 1,60 mi masie ciała 90 kg bierze udział w tych samych ćwiczeniach. Założę się, że ten ostatni traci na wadze. Z drugiej strony: może wskaźnik masy ciała jest lepszym CV niż tylko waga.
xmjx 18.09.11

1
@xmjx: Jeśli uważasz, że początkowa waga wpłynie na ostateczną wagę - i prawdopodobnie masz rację - dobrym pomysłem jest wprowadzenie jej jako przesunięcia w modelu, tak jak to jest tutaj zrobione ...
ocram

3
Ogólnie niepoprawne. Jeśli nachylenie początkowej masy nie wynosi 1,0, analiza zmiany nie będzie równoważna analizie ostatecznej masy, chyba że początkowa waga jest w obu modelach i nie stosuje się zwykłej regresji. Jeśli podstawowa waga znajduje się w dwóch miejscach, model jest trudniejszy do wyjaśnienia, więc powody utrzymywania tego podejścia są niejasne.
Frank Harrell,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.