vcovHC, vcovHAC, NeweyWest - jakiej funkcji użyć?

Próbuję zaktualizować mój model oparty na lm (), aby uzyskać poprawne standardowe błędy i testy. Jestem naprawdę zdezorientowany, której matrycy VC użyć. Do sandwichoferty pakietowe vcovHC, vcovHACi NeweyWest. Podczas gdy te pierwsze uwzględniają tylko heteroskedastyczność, drugie dwa uwzględniają zarówno szeregową korelację, jak i heteroskedastyczność. Jednak dokumentacja niewiele mówi o różnicy między tymi dwoma ostatnimi (przynajmniej tego nie rozumiem). Patrząc na samą funkcję, zdałem sobie sprawę, że NeweyWest faktycznie wywołuje vcovHAC.

Empirycznie wyniki coeftest(mymodel, vcov. = vcovHAC)i coeftest(mymodel, vcov. = NeweyWest)są szalenie różne. Chociaż vcovHACjest nieco zbliżony do naiwnych wyników lm, użycie NeweyWest sprawia, że wszystkie współczynniki stają się nieistotne (testy nawet bliskie 1).

regression time-series neweywest

— hans0l0
źródło

Zwykle strony pomocy R zawierają link do artykułów. Dokładne szczegóły zwykle tam znajdują się. Na przykład artykuł Zeileis jest ogólnodostępny i zawiera bogactwo informacji.

— mpiktas

Artykuł Zeileis wyraźnie określa, czym vcovHACsię różni NeweyWest. Podsumowując, różne metody HAC różnią się jedynie wyborem wag. NeweyWestma określone wagi, vcovHACjest funkcją ogólną, która pozwala podać własne wagi i domyślnie używa wag Andrewsa.

— mpiktas

@mpiktas: thx za podsumowanie. Ponieważ nie podałem żadnych wag, należy użyć odpowiednich wag domyślnych. Teraz, gdy wiem, może powinienem powtórzyć moje pytanie: Dlaczego różne domyślne wagi vcovHAC i NeweyWest mają tak ogromną różnicę i jak określać wagi? Mam na myśli, czy wiesz, jakich wag używa STATA lub innych pakietów?

— hans0l0

wszystkie te obliczenia zależą od tego, że są zmiennymi stacjonarnymi, gdzie są regresorami, a są zaburzeniami. Stacjonarność jest nieco ograniczającą właściwością, więc sprawdź, czy się utrzymuje.

x_{t} u_{t}

$x_tu_t$

x_{t}

$x_t$

u_{t}

$u_t$

— mpiktas

„Kanapka”, o której mowa, to dwa kawałki chleba określone oczekiwaną informacją, obejmujące mięso określone przez obserwowaną informację. Zobacz moje komentarze tutaj i tutaj . W przypadku regresji liniowej równanie szacunkowe wynosi:

U (β) = X^{T} (Y - X^{T} β)

$U(\beta) = \mathbf{X}^T\left(Y - \mathbf{X}^T\beta\right)$

Oczekiwana informacja (chleb) to:

A = \frac{\partial U (β)}{\partial β} = - (X^{T} X)

$A = \frac{\partial U(\beta)}{\partial \beta} = -(\mathbf{X}^T\mathbf{X})$

Obserwowane informacje (mięso) to:

B = E (U (β) U (β)^{T}) = X^{T} (Y - X^{T} β) (Y - X^{T} β)^{T} X

$B = E(U(\beta)U(\beta)^T) = \mathbf{X}^T(Y-\mathbf{X}^T\beta)(Y-\mathbf{X}^T\beta)^T\mathbf{X}$

Należy zauważyć, że wewnętrzny termin jest przekątną stałych reszt, gdy spełnione są homoscedastyczność, niezależne założenie danych, następnie estymator kowariancji kanapkowej, który jest podany przez jest zwykle macierzą kowariancji regresji liniowej gdzie jest wariantem reszt. To jednak dość surowe. Otrzymujesz znacznie szerszą klasę estymatorów, rozluźniając założenia związane z macierzą rezydualną : . $A^{-1}BA^{-1}$ $\sigma^2 \left(\mathbf{X}^T\mathbf{X}\right)^{-1}$ $\sigma^2$ $n \times n$

R = (Y - X^{T} β) (Y - X^{T} β)

$R = (Y-\mathbf{X}^T\beta)(Y-\mathbf{X}^T\beta)$

vcovHCEstymator „HC0” jest spójny, nawet jeśli dane nie są niezależne. Nie powiem więc, że „zakładamy”, że reszty są niezależne, ale powiem, że używamy „działającej niezależnej struktury kowariancji”. Następnie macierz zostaje zastąpiona przekątną reszt $R$

R_{i i} = (Y_{i} - β X_{I .})^{2}, 0 elsewhere

$R_{ii} = (Y_i - \beta \mathbf{X}_{I.})^2, \quad 0\text{ elsewhere}$

Ten estymator działa naprawdę dobrze, z wyjątkiem małych próbek (często rzekomo <40). HC1-3 to różne korekty próbek skończonych. HC3 jest na ogół najlepiej działający.

Jeśli jednak występują efekty autoregresyjne, nie przekątne wpisy są niezerowe, więc powstaje skalowana macierz kowariancji w oparciu o powszechnie stosowane struktury autoregresyjne. Jest to uzasadnienie dla „vcovHAC”. Tutaj tworzone są bardzo elastyczne i ogólne metody szacowania efektu autoregresji: szczegóły mogą wykraczać poza zakres twojego pytania. Funkcja „meatHAC” jest ogólnym koniem roboczym: domyślną metodą jest Andrews. Newey-West jest szczególnym przypadkiem ogólnego autoregresyjnego estymatora błędów. Metody te rozwiązują jeden z dwóch problemów: 1. z jaką prędkością maleje korelacja między „sąsiadującymi” obserwacjami i 2. jaka jest rozsądna odległość między dwiema obserwacjami? Te Jeśli masz zrównoważone dane panelowe, ten estymator kowariancji jest przesadą. $T$ geegeezamiast tego określa strukturę kowariancji AR-1lub podobną.

Co do zastosowania, zależy od charakteru analizy danych i pytania naukowego. Nie radzę dopasowywać wszystkich typów i wybierać ten, który wygląda najlepiej, ponieważ jest to problem wielokrotnego testowania. Jak wspomniałem wcześniej, estymator vcovHC jest spójny nawet w obecności efektu autoregresji, dzięki czemu można stosować i uzasadniać „działający model korelacji niezależności” w różnych okolicznościach.

— AdamO
źródło