Polecam sprawdzenie w większości nieszkodliwych ekonometrii - mają dobre wytłumaczenie na poziomie intuicyjnym.
Problem, który próbujesz rozwiązać, to stronniczość wyboru. Jeśli zmienna jest skorelowana z potencjalnymi wynikami i prawdopodobieństwem otrzymania leczenia, to jeśli okaże się, że oczekiwany wynik leczenia jest lepszy niż oczekiwany wynik nieleczonego, może to być fałszywym odkryciem, ponieważ leczone zwykle mają wyższe a zatem mają wyższe . Problem powstaje, ponieważ powoduje, że koreluje z leczeniem.xjay0 i, y1 ixy0 i, y1 ixy0 i, y1 i
Ten problem można rozwiązać, kontrolując . Jeśli uważamy, że związek między potencjalnymi wynikami a zmiennymi jest liniowy, po prostu robimy to, włączając do regresji ze zmienną fikcyjną do leczenia, a zmienna fikcyjna wchodzi w interakcję z . Oczywiście regresja liniowa jest elastyczna, ponieważ możemy również uwzględnić funkcje . Ale co, jeśli nie chcemy narzucać formy funkcjonalnej? Następnie musimy zastosować podejście nieparametryczne: dopasowanie.xxxxx
Przy dopasowywaniu porównujemy obserwacje traktowane i nietraktowane z podobnym . Odchodzimy od tego z oszacowaniem efektu leczenia dla wszystkich wartości (lub małych zakresów wartości lub „segmentów”), dla których dokonaliśmy zarówno obserwacji, jak i nieleczonych obserwacji. Jeśli nie mamy wielu takich wartości lub segmentów, w szczególności jeśli jest wektorem wysokowymiarowym, więc trudno jest znaleźć obserwacje blisko siebie, pomocne jest rzutowanie tej przestrzeni na jeden wymiar.xxxx
Właśnie to robi dopasowanie skłonności. Jeśli są skorelowane z leczeniem podanym , wówczas okazuje się, że nie są one również skorelowane z leczeniem podanym gdzie jest prawdopodobieństwem leczenia podanym , tj. Wynikiem skłonności z .y0 i, y1 ixjap ( xja)p ( x )xx
Oto twoja intuicja: jeśli znajdziemy podpróbkę obserwacji o bardzo podobnym wyniku skłonności , to dla tej podpróbki grupy poddane działaniu i nieleczone nie są skorelowane z parametrem . Każda obserwacja jest jednakowo traktowana lub nieleczona; oznacza to, że każda obserwacja poddana leczeniu jest równie prawdopodobna z dowolnej wartości w próbie częściowej. Ponieważ jest tym, co determinuje potencjalne wyniki w naszym modelu, oznacza to, że dla tej podpróbki potencjalne wynikip ( x )xxxy0 i, y1 isą niezwiązane z leczeniem. Ten warunek zapewnia, że średnia różnica wyniku w podgrupie między badaną i nieleczoną jest spójnym oszacowaniem średniego efektu leczenia na tę próbkę, tj.
mi[ yja| Traktowane,p(x)]-E[ yja| Nieleczona,p(x)]
jest spójnym oszacowaniem lokalnego średniego efektu leczenia.
Dalsza lektura:
Czy naprawdę powinniśmy w praktyce stosować dopasowywanie wyników skłonności?
Powiązane pytanie porównujące dopasowanie i regresję