Bezzasadność w modelu przyczynowym Rubina - wyjaśnienie Laika


13

Wdrażając model przyczynowy Rubina, jednym z (niestabilnych) założeń, których potrzebujemy, jest nieuzasadnienie, co oznacza

(Y(0),Y(1))T|X

Tam, gdzie LHS jest alternatywą, T to leczenie, a X to zmienne towarzyszące, które kontrolujemy.

Zastanawiam się, jak to opisać osobie, która nie wie dużo o modelu przyczynowym Rubina. Rozumiem, dlaczego teoretycznie potrzebujemy tego założenia, ale nie jestem pewien koncepcyjnie, dlaczego jest to ważne. W szczególności, jeśli T jest leczeniem, czy potencjalny wynik nie powinien być od niego bardzo zależny? A także, jeśli ma randomizacją, to automatycznie . Dlaczego to prawda?(Y(0),Y(1))T

Jak opisałbyś założenie o bezzasadności / niewiedzy dla kogoś, kto nie studiował RCM?


Jeśli chodzi o dopasowanie wyniku skłonności, po pierwsze łatwo jest udowodnić, że rozkład warunkowy pokrywa się z rozkładem warunkowym . Dlatego brak bezpodstawności / ignorancja implikuje, że . W badaniach randomizowanych musi być niezależny od jakiejkolwiek innej zmiennej uczestniczącej w badaniach. X | T=1,p(X)=qX | T=0,p(X)=q(Y(0),Y(1))  T | p(X)T
Viktor

Odpowiedzi:


12

Jak opisałbyś założenie o bezzasadności / niewiedzy dla kogoś, kto nie studiował RCM?

Jeśli chodzi o intuicję dla kogoś, kto nie jest obeznany z wnioskami przyczynowymi, myślę, że tutaj można użyć wykresów. Są intuicyjne w tym sensie, że wizualnie pokazują „przepływ”, a także wyjaśnią, co w rzeczywistości niewiedza oznacza w rzeczywistości.

Warunkowa ignorancja jest równoznaczna z twierdzeniem, że spełnia kryterium backdoora. Tak więc, w intuicyjny sposób, możesz powiedzieć osobie, że zmienne towarzyszące, które wybrałeś dla „blokuje” efekt typowych przyczyn i (i nie otwierają żadnych innych fałszywych skojarzeń).XXTY

Jeśli jedynymi możliwymi do zakłócania zmiennymi twojego problemu są zmienne na samym , to jest to łatwe do wyjaśnienia. Mówisz tylko, że skoro wszystkie typowe przyczyny zarówno jak i , to wszystko, nad czym musisz kontrolować. Możesz więc powiedzieć jej, że tak postrzegasz świat:XXTY

wprowadź opis zdjęcia tutaj

Bardziej interesujący jest przypadek, gdy mogą istnieć inne prawdopodobne czynniki zakłócające. Aby być bardziej szczegółowe, można nawet poprosić osobę, aby wymienić wikłającym czynnikiem swojego problemu - to znaczy, poprosić ją nazwać coś, co powoduje zarówno i , ale nie jest w .TYX

Powiedzieć nazwami osoba zmiennej . Wtedy można powiedzieć tej osobie, że to, co Twój warunkowy ignorability założenie skutecznego oznacza, że uważasz będzie „blok” efekt na i / lub . ZXZTY

I powinieneś podać jej merytoryczny powód, dla którego uważasz, że to prawda. Istnieje wiele wykresów, które mogą to reprezentować, ale powiedz, że wymyśliłeś to wyjaśnienie: „ nie będzie stronniczości wyników, ponieważ chociaż powoduje i , jego wpływ na przechodzi tylko przez , nad którym kontrolujemy”. ZZTYTXA następnie pokaż ten wykres:

wprowadź opis zdjęcia tutaj

I możesz pomyśleć o innych współzałożycielach i pokazać jej, w jaki sposób blokuje je wizualnie na wykresach.X

Teraz odpowiadając na pytania koncepcyjne:

W szczególności, jeśli T jest leczeniem, czy potencjalny wynik nie powinien być od niego bardzo zależny? Również, jeśli mamy randomizowaną kontrolowaną próbę, to automatycznie,. Dlaczego to prawda?

Nie. Pomyśl o jako o zadaniu leczenia. Mówi się, że przypisujesz leczenie ludziom, „ignorując” ich reakcję na leczenie (potencjalne skutki alternatywne). Prostym naruszeniem tego byłoby skłonność do leczenia tych, którzy potencjalnie skorzystaliby na tym najwięcej.T

Dlatego tak się dzieje automatycznie podczas losowania. Jeśli wybierzesz leczonego losowo, oznacza to, że nie sprawdziłeś ich potencjalnych odpowiedzi na leczenie, aby je wybrać.


Aby uzupełnić odpowiedź, warto zauważyć, że zrozumienie niewiedzy bez mówienia o procesie przyczynowym, to znaczy bez odwoływania się do równań strukturalnych / modeli graficznych jest naprawdę trudne. Przez większość czasu naukowcy odwołują się do idei „leczenie było jak gdyby losowe”, ale bez uzasadnienia, dlaczego tak jest lub dlaczego jest to prawdopodobne przy użyciu mechanizmów i procesów w świecie rzeczywistym.

W rzeczywistości wielu badaczy po prostu zakłada wygodę ignorancji dla uzasadnienia zastosowania metod statystycznych. Ten fragment z pism Joffe, Yang i Feldman mówi niewygodną prawdę, którą większość ludzi zna, ale nie mówi podczas prezentacji na konferencji: „Założenia dotyczące ignorancji są zwykle przyjmowane, ponieważ uzasadniają zastosowanie dostępnych metod statystycznych, a nie dlatego, że naprawdę się w to wierzy”.

Ale, jak powiedziałem na początku odpowiedzi, możesz użyć wykresów, aby spierać się o to, czy przypisanie do leczenia jest ignorowalne, czy nie. Chociaż sama koncepcja niewiedzy jest trudna do zrozumienia, ponieważ zawiera osądy o wielkościach przeciwnych, na wykresach podajesz w zasadzie stwierdzenia jakościowe o procesach przyczynowych (ta zmienna powoduje tę zmienną itp.), Które są łatwe do wyjaśnienia i atrakcyjne wizualnie.

Jak wspomniano w poprzedniej odpowiedzi, istnieje formalna równoważność między wykresami a potencjalnymi wynikami . Dlatego też możesz odczytać potencjalne wyniki z wykresów. Uczyniwszy to połączenie bardziej formalnym (więcej w: Przyczynowość Pearl'a, s. 333), można zastosować następującą definicję: potencjalne wyniki oznaczałyby sumę wszystkich zmiennych (obserwowanych i błędów), które wpływają na Y, gdy T jest utrzymywane na stałym poziomie .

Łatwo więc zrozumieć, dlaczego ignorancja ma zastosowanie w RCT, ale co ważniejsze, pozwala również łatwo dostrzec sytuacje, w których niewiedza by się nie utrzymała. Na przykład na wykresie , T jest ignorowalne, ale T nie jest warunkowo ignorowalne, biorąc pod uwagę X, ponieważ po warunku na X otworzysz ścieżkę kolizyjną od terminu błędu X do T.TXY

Podsumowując, wielu badaczy domyślnie przyjmuje dla wygody założenie o niewiedzy. Jest to wygodny sposób, aby założyć, że zestaw elementów sterujących jest wystarczający, bez konieczności formalnego uzasadnienia, dlaczego tak jest, ale aby wyjaśnić, co to znaczy w prawdziwym kontekście dla laika, należy przywołać historię przyczynową, czyli założenia przyczynowe , i możesz formalnie opowiedzieć tę historię za pomocą wykresów przyczynowych.


8

Myślę, że są coraz odłożył na różnicy pomiędzy potencjalnymi wynikami a obserwowany wynik . Leczenie ma duży wpływ na to drugie, ale mamy nadzieję, że pierwsza para nie.(Y0,Y1)Y

Oto intuicja (odkładając warunkowanie na dla uproszczenia) na temat obserwowanego wyniku. Dla każdej obserwacji zrealizowany wynik można wyrazić jakoX

Y=TY1+(1T)Y0.

Oznacza to, że i są zależne, ponieważ średnia wartość nie będzie równa średniej (o ile efekt leczenia jest różny od zera, a leczenie jest losowe / ignorowalne) .YTTY1(1T)Y0

Oto intuicja drugiej części. Jeśli chcemy dowiedzieć się o przyczynowym skutku , porównamy obserwacje traktowane i nieleczone, biorąc pod uwagę różnice wZakładamy, że grupa kontrolna stanowi scenariusz alternatywny dla grupy leczonej, gdyby nie otrzymali leczenia. Ale jeśli ludzie wybiorą własne leczenie w oparciu o ich potencjalne wyniki (lub oczekiwania dotyczące potencjalnych wyników), to porównanie to jabłka do orangutanów. To jest jak próba medyczna, w której tylko zdrowi pacjenci wybierają bolesną operację, ponieważ jest to dla nich warte kosztów. Nasze porównanie zostanie skażone, jeśli wybór leczenia nie będzie przypadkowy po warunkowaniu naTXX(zmienne mierzące aktualny stan zdrowia, które powinny być obserwowalne przez lekarza i pacjentów). Jednym z przykładów nieobserwowalnej zmiennej może być małżonek, który bardzo cię kocha, więc zachęca cię do zabiegu, ale także upewnia się, że trzymasz się zaleceń lekarza po operacji, poprawiając w ten sposób wynik . Zmierzony efekt jest teraz połączeniem operacji i miłosnej pomocy, której nie chcemy mierzyć. Lepszym przykładem jest który wpływa leczenie, ex post lub ex ante w oczekiwaniu na leczenie.Y1X


Patrząc na część, w której mówisz: „Myślę, że nie rozumiesz różnicy między potencjalnymi wynikami (Y0, Y1) a obserwowanym wynikiem Y. Na to drugie ma duży wpływ leczenie, ale mamy nadzieję, że nie jest to pierwsza para. „ Czy można to interpretować jako „Obserwowany wynik zależy od leczenia, ale przy zerowej hipotezie braku efektu leczenia, leczenie nie powinno wpływać na potencjalne wyniki”? Dlaczego mamy nadzieję, że leczenie
wpłynie

1
@RayVelcoro Nie, nie tak to ująłbym. Powiedziałbym, że wiedza o tym, czy ktoś jest przypisany (lub wybiera) leczenie, nie zawiera żadnych informacji na temat jego wyników „co, jeśli” zarówno w stanach leczonych, jak i nieleczonych, zależnych od jego Xs, oraz żadnych informacji na temat jakichkolwiek zdefiniowanych przez nich efektów przyczynowych, takich jak . Nie ma to nic wspólnego z efektem zerowym zero. Y1Y0
Dimitriy V. Masterov,

Czy mogę zapytać, dlaczego fakt, że średnia nie jest równa średniej sugeruje, że i są zależne? dziękiTY1(1T)Y0YT
user321627,

@ user321627 Jeśli obliczysz różnicę w obserwowanych średnich wyników leczenia i kontroli, powinno to być oczywiste.
Dimitriy V. Masterov
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.