„Kanapka”, o której mowa, to dwa kawałki chleba określone oczekiwaną informacją, obejmujące mięso określone przez obserwowaną informację. Zobacz moje komentarze tutaj i tutaj . W przypadku regresji liniowej równanie szacunkowe wynosi:
U(β)=XT(Y−XTβ)
Oczekiwana informacja (chleb) to:
A=∂U(β)∂β=−(XTX)
Obserwowane informacje (mięso) to:
B=E(U(β)U(β)T)=XT(Y−XTβ)(Y−XTβ)TX
Należy zauważyć, że wewnętrzny termin jest przekątną stałych reszt, gdy spełnione są homoscedastyczność, niezależne założenie danych, następnie estymator kowariancji kanapkowej, który jest podany przez jest zwykle macierzą kowariancji regresji liniowej gdzie jest wariantem reszt. To jednak dość surowe. Otrzymujesz znacznie szerszą klasę estymatorów, rozluźniając założenia związane z macierzą rezydualną : .A−1BA−1σ2(XTX)−1σ2n×n
R=(Y−XTβ)(Y−XTβ)
vcovHC
Estymator „HC0” jest spójny, nawet jeśli dane nie są niezależne. Nie powiem więc, że „zakładamy”, że reszty są niezależne, ale powiem, że używamy „działającej niezależnej struktury kowariancji”. Następnie macierz zostaje zastąpiona przekątną resztR
Rii=(Yi−βXI.)2,0 elsewhere
Ten estymator działa naprawdę dobrze, z wyjątkiem małych próbek (często rzekomo <40). HC1-3 to różne korekty próbek skończonych. HC3 jest na ogół najlepiej działający.
Jeśli jednak występują efekty autoregresyjne, nie przekątne wpisy są niezerowe, więc powstaje skalowana macierz kowariancji w oparciu o powszechnie stosowane struktury autoregresyjne. Jest to uzasadnienie dla „vcovHAC”. Tutaj tworzone są bardzo elastyczne i ogólne metody szacowania efektu autoregresji: szczegóły mogą wykraczać poza zakres twojego pytania. Funkcja „meatHAC” jest ogólnym koniem roboczym: domyślną metodą jest Andrews. Newey-West jest szczególnym przypadkiem ogólnego autoregresyjnego estymatora błędów. Metody te rozwiązują jeden z dwóch problemów: 1. z jaką prędkością maleje korelacja między „sąsiadującymi” obserwacjami i 2. jaka jest rozsądna odległość między dwiema obserwacjami? Te Jeśli masz zrównoważone dane panelowe, ten estymator kowariancji jest przesadą.Tgee
gee
zamiast tego określa strukturę kowariancji AR-1
lub podobną.
Co do zastosowania, zależy od charakteru analizy danych i pytania naukowego. Nie radzę dopasowywać wszystkich typów i wybierać ten, który wygląda najlepiej, ponieważ jest to problem wielokrotnego testowania. Jak wspomniałem wcześniej, estymator vcovHC jest spójny nawet w obecności efektu autoregresji, dzięki czemu można stosować i uzasadniać „działający model korelacji niezależności” w różnych okolicznościach.