Włączenie opóźnionej zmiennej zależnej do regresji


26

Jestem bardzo zdezorientowany, czy uzasadnione jest włączenie opóźnionej zmiennej zależnej do modelu regresji. Zasadniczo myślę, że jeśli ten model skupia się na związku między zmianą Y i innymi zmiennymi niezależnymi, to dodanie opóźnionej zmiennej zależnej po prawej stronie może zagwarantować, że współczynnik przed innymi IV jest niezależny od poprzedniej wartości Y.

Niektórzy twierdzą, że włączenie LDV spowoduje tendencyjność w dół współczynnika innych IV. Inni twierdzą, że można uwzględnić LDV, co może zmniejszyć korelację szeregową.

Wiem, że to pytanie jest dość ogólne, jeśli chodzi o rodzaj regresji. Ale moja wiedza statystyczna jest ograniczona i naprawdę trudno mi się zastanowić, czy powinienem uwzględnić opóźnioną zmienną zależną w modelu regresji, gdy skupiam się na zmianie Y w czasie.

Czy istnieją inne podejścia do radzenia sobie z wpływem X na zmianę Y w czasie? Próbowałem również różnych wyników zmian jako DV, ale R kwadrat w tej sytuacji jest bardzo niski.


1
co masz nadzieję osiągnąć dzięki swojemu modelowi? Maksymalizacja kwadratu R rzadko jest dobrym kryterium wyboru modelu.
Michael Bishop

Ten model zostanie wykorzystany do przewidywania. Prawdą jest, że chociaż R-kwadrat bardzo się różnią, przewidywane wartości są w rzeczywistości takie same przy użyciu Y lub zmiany Y. Jednak biorąc pod uwagę niską wartość R-kwadrat przy użyciu zmiany Y jako DV, czy to oznacza, że obecny zestaw IV nie jest w stanie bardzo dobrze wyjaśnić zmiany i muszą być jakieś zmienne pominięte?
user22109 17.03.13

Odpowiedzi:


19

Decyzja o włączeniu opóźnionej zmiennej zależnej do modelu jest naprawdę pytaniem teoretycznym. Sensowne jest dołączenie opóźnionego sygnału DV, jeśli oczekujesz, że bieżący poziom DV jest silnie uzależniony od jego wcześniejszego poziomu. W takim przypadku nieuwzględnienie opóźnionego sygnału DV doprowadzi do pominięcia zmiennej zmienności, a wyniki mogą być niewiarygodne. W takim scenariuszu, w tym opóźnione DV, wyeliminuje wiele wariancji i może sprawić, że inne efekty DV będą mniej znaczące (co oznacza, że ​​zarówno mniejsze, jak i standardowe błędy większe). Jednak to, co możesz zrobić, to powiedzieć, że te IV, które nadal wpływają na twój wynik, mają wpływ na kontrolę wartości przeszłej DV. Alternatywnym podejściem jest wykorzystanie różnicy między zmienną wyniku w okresieβtoraz jako DV dla okresu .t-1t

Jednak wykonanie któregokolwiek z nich oznacza odpowiedź na ważne pytanie: jaka jest właściwa struktura opóźnienia dla twojego DV? Możesz uzyskać pewne informacje na ten temat, obserwując korelację między zmienną wynikową ze sobą dla różnych wartości opóźnień (np. Korelacja między Y a Y , Y i Y itp.).t-1t-2)


12

Polecam dwa artykuły:

  1. Achen CH (2001) Dlaczego zmienne zależne opóźnione mogą tłumić moc wyjaśniającą innych zmiennych niezależnych ( link )
  2. Keele, L. i Kelly NJ (2005) Modele dynamiczne dla teorii dynamicznych: tajniki zmiennych zależnych opóźnionych ( link ).

Wynik jest taki, że włączenie opóźnionej zmiennej zależnej może mieć duży wpływ na współczynniki pozostałych zmiennych. Czasami jest to właściwe (w przypadku modeli dynamicznych Keele i Kelly), a czasem nie. Jak powiedzieli inni, ważne jest, aby pomyśleć o modelowanym procesie.


4

Uwzględnienie opóźnionych zmiennych zależnych może zmniejszyć występowanie autokorelacji wynikającej z błędnej specyfikacji modelu. Zatem uwzględnianie opóźnionych zmiennych zależnych pomaga bronić istnienia autokorelacji w modelu. Wcześniejsza wartość wpływa na teraźniejszość w modelu, wymaga podstaw teoretycznych i najlepiej pasuje do modelu zgodnie z wymaganiami.


Nie jestem pewien, czy dotrzymałem ostatniego zdania; proszę edit czy znaczenie może zostać wyjaśniona. Witamy w Cross Validated BTW!
Nick Stauner

1
Autokorelacja może być artefaktem sposobu gromadzenia danych. Dane uzyskałem przez digitalizację wykresu, co oznaczało, że dane zostały posortowane. To sortowanie i zależność nieliniowa spowodowały autokorelację reszt.
Tony Ladson,

2

To, co mnie intryguje w związku z tym pytaniem, to brak wiedzy na temat specyfikacji modelu lub techniki jego oszacowania. Wspominam, że chociaż użycie opóźnionego DV wśród IV może być teoretycznie ważne i konieczne metodologicznie, może również wprowadzić ryzykowną ilość endongeniczności w modelu, w zależności od istotnej zależności między zmiennymi a jednostkami czasu, a także od AR kolejność, która może istnieć w modelu. O ile ty (i my) nie posiadasz więcej szczegółów na temat zmiennych i estymacji, nie czułbym się komfortowo polecając opóźnienie DV, chyba że myślisz o jakiejś technice zmiennej instrumentalnej lub czymś takim jak estymacja Arellano-Bonda.

Podaj nam więcej szczegółów, abyśmy mogli lepiej wiedzieć, o jakim modelu mówimy.


0

Tak, powinieneś uważać na uprzedzenia Nickella w małej sytuacji T dużej N. (Nickell, S. (1981). Biases w modelach dynamicznych z ustalonymi efektami. Econometrica: Journal of the Econometric Society, 1417-1426.)

Warto przyjrzeć się modelom dynamicznych danych panelowych, takim jak estymatory Arellano-Bond lub Blundell-Bond.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.