Komentarz w innym pytaniu wzbudził wątpliwości co do znaczenia warunku , argumentując, że można go poprawić poprzez włączenie stałego terminu do specyfikacji regresji, a zatem „można go łatwo zignorować”.E(u∣X)=0
Tak nie jest. Włączenie stałego składnika do regresji pochłonie potencjalnie niezerową średnią warunkową błędu, jeśli założymy, że ta średnia warunkowa jest już stała, a nie funkcją regresorów . Jest to kluczowe założenie, które należy przyjąć niezależnie od tego, czy uwzględniamy stały termin, czy nie:
E(u∣X)=const.
Jeśli tak się stanie, wówczas niezerowa średnia staje się uciążliwością, którą możemy po prostu rozwiązać, dołączając stały składnik.
Ale jeśli tak się nie stanie (tj. Jeśli średnia warunkowa nie jest stałą zerową lub niezerową ), włączenie terminu stałego nie rozwiązuje problemu: to, co „absorbuje” w tym przypadku, jest wielkością zależy to od konkretnej próby i realizacji regresorów. W rzeczywistości nieznany współczynnik przypisany do szeregu jedności nie jest tak naprawdę stały, ale zmienny, w zależności od regresorów poprzez niestałą średnią warunkową składnika błędu.
Co to oznacza?
Aby uprościć, załóżmy najprostszy przypadek, w którym ( i indeksuje obserwacje), ale E ( u i ∣ x i ) = h ( x i ) . To znaczy, że termin średni błąd jest niezależny od regresorów z wyjątkiem jego ówczesnych te (w X mamy nie obejmują serię jedynek).E(ui∣X−i)=0iE(ui∣xi)=h(xi)X
Załóżmy, że określamy regresję z uwzględnieniem stałego terminu (regresor szeregu jednych).
y=a+Xβ+ε
i notacja kompaktowania
y=Zγ+ε
gdzie , Z = [ 1 : X ] , γ = ( , P ) ' , ε = U - .a=(a,a,a...)′Z=[1:X]γ=(a,β)′ε=u−a
Wtedy będzie estymator OLS
γ^=γ+(Z′Z)−1Z′ε
Dla bezstronności potrzebujemy . AleE[ε∣Z]=0
E[εi∣xi]=E[ui−a∣xi]=h(xi)−a
który nie może być zerowy dla wszystkich , ponieważ badamy przypadek, w którym h ( x i ) nie jest funkcją stałą. Więcih(xi)
E[ε∣Z]≠0⟹E(γ^)≠γ
i
Jeśli , to nawet jeśli uwzględnimy regresję w stałej wartości, estymator OLS nie będzie bezstronny , co oznacza również, że wynik Gaussa-Markowa dotyczący wydajności został utraconyE(ui∣xi)=h(xi)≠h(xj)=E(uj∣xj) .
Ponadto, termin błędu ma inną średnią dla każdego i , a więc także inną wariancję (tj. Jest warunkowo heteroskedastyczny). Więc jego dystrybucja uwarunkowane regresorów różni się w uwagach í . εii
Ale to oznacza, że nawet jeśli termin błąd zakłada się normalne, a następnie rozkład błędu próbkowania y - γ będzie normalne, ale nie zerową średnią mormal iz nieznanego błędu. I wariancja będzie się różnić. Więcuiγ^−γ
Jeśli , to nawet jeśli uwzględnimy regresję w stałej wartości, testowanie hipotez nie jest już ważne.E(ui∣xi)=h(xi)≠h(xj)=E(uj∣xj)
Innymi słowy, właściwości „skończonej próbki” zniknęły.
Pozostaje nam tylko skorzystać z asymptotycznie ważnego wnioskowania, dla którego będziemy musieli poczynić dodatkowe założenia.
So simply put, Strict Exogeneity cannot be "easily ignored".