Dla tych, którzy nie znają poniższego fragmentu kodu ze Staty, udostępniono OP
ivreg my_dv var1 var2 var3 (L.my_dv = D2.my_dv D3.my_dv D4.my_dv)
równanie to można odczytać jako
Yt=α+β1(Var1)+β2(Var1)+β3(Var1)+β4(Y~t−1)
Y~t−1
Y~t−1=α+Z1(Δ2Yt)+Z2(Δ3Yt)+Z3(Δ4Yt)
(tzn. pierwszy etap równania IV znajduje się w nawiasie w kodzie Stata)
Delty reprezentują różnice drugiego, trzeciego i czwartego rzędu i są używane jako instrumenty wykluczone do oszacowania opóźnienia zmiennej zależnej.
L.
t−1D.
D2.
Zasadniczo nie mogłem wymyślić żadnego logicznego uzasadnienia, dlaczego ktoś miałby to zrobić. Ale Kwak wskazał (odwołując się do tego artykułu ), że metoda Arellano-Bonda wykorzystuje różnice jako instrumenty do oszacowania komponentu auto-regresyjnego modelu. (Również początkowo założyłem, że różnice będą miały wpływ tylko wtedy, gdy seria nie będzie stacjonarna, co według Bond'a w tym powiązanym dokumencie różnice będą jedynie słabymi instrumentami w przypadku, gdy seria jest losowym przejściem, str. 21 )
Jako sugestie dotyczące dalszego czytania materiału jako wprowadzenia do zmiennych instrumentalnych,
Kolejny plakat w tej odpowiedzi (Charlie) powiązany z niektórymi slajdami, które przygotował, które mi się podobają i które sugerują, warto poszukać wprowadzenia do zmiennych instrumentalnych. Chciałbym również zasugerować to PowerPoint profesor kopalni przygotowane na warsztatach jako wprowadzenie, jak również. Jako ostatnia sugestia dla każdego, kto chce dowiedzieć się więcej o zmiennych instrumentalnych, powinieneś przyjrzeć się pracy Joshua Angrista.
Oto moja wstępna odpowiedź
L.
t−1D.
D2.
We wszystkich aplikacjach, które widziałem, ludzie wykorzystują opóźnienie zmiennych niezależnych jako instrumenty do oszacowania opóźnienia zmiennej zależnej (z powodów, o których mówi). Jest to jednak oparte na założeniu, że opóźnione zmienne niezależne są egzogenne względem terminu błędu w okresie, w którym są stosowane.
Nie znam żadnego uzasadnienia, w którym różnice zmiennej zależnej byłyby uważane za egzogeniczne. O ile mi wiadomo, nie akceptuje się praktyki różnicowania tylko jednej strony równania i dałoby to raczej nielogiczne wyniki ( tutaj jest artykuł krytykujący kogoś o odwrotnej sytuacji, w której uwzględniono poziom zmiennych jako predyktor zróżnicowana seria.) Jeśli zmienisz terminy w równaniu IV, to faktycznie będzie wyglądać podobnie do rozszerzonego testu Dickeya Fullera.
O ile najprostszą odpowiedzią byłoby zapytanie osoby, która napisała kod, czy ktoś może podać przykład, w którym procedura ta byłaby do przyjęcia, lub w jakiejkolwiek sytuacji, w której procedura ta zwróciłaby jakieś znaczące wyniki? Ponieważ nie mogę wymyślić żadnego logicznego uzasadnienia, dlaczego różnice miałyby wpływ na poziomy, z wyjątkiem przypadku, gdy seria nie jest stacjonarna.