Kilka dni temu było podobne pytanie, które zawierało odpowiednie odniesienie:
- Belloni, A., Chernozhukov, V. i Hansen, C. (2014) „Wnioskowanie na temat efektów leczenia po selekcji wśród kontroli wysokowymiarowych”, Review of Economic Studies, 81 (2), s. 608-50 ( link )
Przynajmniej dla mnie ten artykuł jest dość trudny do przeczytania, ponieważ dowody tego stosunkowo prostego są dość skomplikowane. Gdy jesteś zainteresowany oszacowaniem modelu takiego jak
yja= α Tja+ X′jaβ+ ϵja
gdzie jest twoim wynikiem, T i jest pewnym interesującym efektem leczenia, a X i jest wektorem potencjalnych kontroli. Docelowym parametrem jest α . Zakładając, że większość zmian w wyniku jest wyjaśniona przez leczenie i rzadki zestaw kontroli, Belloni i in. (2014) opracowali podwójnie niezawodną metodę selekcji, która zapewnia prawidłowe szacunki punktowe i prawidłowe przedziały ufności. To założenie rzadkości jest jednak ważne.yjaT.jaXjaα
Xjayja
- yjaXja
- T.jaXja
- yjaT.ja
Dostarczają dowody potwierdzające, dlaczego to działa i dlaczego otrzymujesz prawidłowe przedziały ufności itp. Z tej metody. Pokazują również, że jeśli wykonasz selekcję LASSO tylko na powyższej regresji, a następnie cofniesz wynik leczenia i wybrane zmienne, otrzymasz błędne oceny punktowe i przedziały fałszywego zaufania, jak już powiedział Björn.
Cel ten jest dwojaki: porównanie początkowego modelu, w którym wybór zmiennych kierowany był intuicją lub teorią, z modelem podwójnie niezawodnym, daje wyobrażenie o tym, jak dobry był twój pierwszy model. Być może twój pierwszy model zapomniał o niektórych ważnych kwadratach lub terminach interakcji, przez co cierpi z powodu źle określonej formy funkcjonalnej lub pominiętych zmiennych. Po drugie, Belloni i in. (2014) metoda może poprawić wnioskowanie na temat parametru docelowego, ponieważ nadmiarowe regresory zostały ukarane w swojej procedurze.