Rozważ następujący model regresji wielokrotnej:
Tutaj jest wektorem kolumny; Macierz a ; a wektor kolumny; a macierz; a wektor kolumnowy; i U , termin błędu, wektor kolumny n \ times1 .
PYTANIE
Mój wykładowca, podręcznik Wprowadzenie do ekonometrii, wydanie 3. autorzy James H. Stock i Mark W. Watson, str. 281 oraz Econometrics: Honor's Exam Review Session (PDF) , s. 1. 7, wyraził mi następujące.
- Jeśli założymy, że tak zwana warunkowa oznacza niezależność , co z definicji oznacza, że
a jeżeli założenie najmniejszych kwadratów jest spełnione, z wyjątkiem założenia warunkowego średniego zera (więc przyjmujemy ) (patrz 1 -3 poniżej),
następnie estymator OLS z w pozostaje bezstronny i spójny, przy tym słabszym zestawie założeń.
Jak udowodnić tę propozycję? To znaczy, że 1 i 2 powyżej sugerują, że oszacowanie OLS dla daje nam obiektywny i spójny szacunek dla ? Czy jest jakiś artykuł badawczy potwierdzający tę propozycję?
KOMENTARZ
Najprostszy przypadek podano, biorąc pod uwagę model regresji liniowej i udowodnij, że oszacowanie OLS z jest bezstronny, jeśli dla każdego .
DOWÓD NIEBIADOMOŚCI PRZYZNAJĄCY, ŻE I SĄ WSPÓLNIE NORMALNIE ROZPOWSZECHNIANE
Zdefiniuj , a następnie iZatem można przepisać jako Do następnie wynika, że Teraz, ponieważ i są wspólnie normalnie rozłożone, teoria rozkładów normalnych, por. Wyprowadzając rozkłady warunkowe wielowymiarowego rozkładu normalnego , mówi, że (w rzeczywistości nie musimy zakładać wspólnej normalności, ale tylko tę tożsamość) dla pewnego wektora na
Teraz staje się W modelu spełnione są założenia najmniejszych kwadratów, ponieważ warunek błędu spełnia założenie warunkowe oznacza zero. Oznacza to, że oszacowanie OLS dla będzie bezstronne, ponieważ jeśli pozwolimy , a będzie przez macierz złożona z i , a następnie oszacowanie OLS dla w biorąc pod uwagę następujące kwestie:
a zatem gdzie druga linia następuje po . Zatem jest warunkowo bezstronnym oszacowaniem ponieważ oszacowanie OLS podane dla modelu pokrywa się z oszacowaniem dla modelu . Teraz, zgodnie z prawem całkowitego oczekiwania, a zatem jest obiektywnym oszacowaniem dla .
(Można zauważyć, że , więc współczynnik na niekoniecznie jest obiektywny.)
Jednak powyższy szczególny przypadek zakłada, że i są wspólnie dystrybuowane normalnie, jak mogę udowodnić propozycję bez tego założenia?
Zakładając, że zawsze wystarcza (por. ), ale powinienem uzyskać wynik po prostu za pomocą i założenia najmniejszych kwadratów z wyłączeniem założenia warunkowego średniego zera ( patrz poniżej).
DOTYCZĄCE SPÓJNOŚCI
Myślę, że można również zauważyć, że oszacowanie jest spójne dla , zauważając, że w modelu regresji spełnione są wszystkie założenia najmniejszych kwadratów, w tym założenie, że (nowy) termin błędu spełnia Założenie warunkowe średniej zerowej (por. I patrz poniżej).
Mogę później dodać dowód spójności, który jest oparty na serii ćwiczeń we Wstępie do ekonometrii, wyd. 3. autorzy James H. Stock i Mark W. Watson, rozdz. 18. Jednak ten dowód jest dość długi. Ale chodzi tutaj o to, że dowód dostarczony w ćwiczeniach zakłada , więc wciąż zastanawiam się, czy założenie naprawdę wystarcza.
SUBQUERY 1
We wstępie do ekonometrii, wyd. 3. James H. Stock i Mark W. Watson, mówi się, na str. 300, że założenie można „rozluźnić” przy użyciu teorii regresji nieliniowej. Co przez to rozumieją?
NAJMNIEJSZE ZAŁOŻENIA KWADRATÓW
Wykluczam tutaj warunkowe średnie zero zero, że ponieważ twierdzenie, które próbujemy tutaj udowodnić, dopuszcza przypadki, w których . Są to przypadki, gdy na przykład jest skorelowana z . Por. Econometrics: Honor's Exam Review Session (PDF) , s. 1 7
Założenie, że najmniejsze kwadraty są następujące.
Rozkłady wspólne , są iid, gdzie jest -tym elementem w a i są tego rzędu w i .
Duże odstające są mało prawdopodobne, czyli dla każdego , i mieć skończone czwarty momenty, gdzie to : th element .
ma pełną rangę kolumny (tzn. Nie ma doskonałej wielokoliniowości; zapewnia to odwracalność ).
( Rozszerzone założenia najmniejszych kwadratów : Chociaż nie uważam, że jest to konieczne (i powiedziano mi, że tak nie jest), możemy również założyć homoskedastyczność, tj. dla każdego oraz że podany rozkład warunkowy jest normalny dla każdego (tzn. Mamy normalne błędy.))
UWAGA DOTYCZĄCA TERMINOLOGII
W założenie, że warunkowo średnia zero jest założeniem, że . Założenie o warunkowej średniej niezależności jest jednak założeniem, że .
Ta terminologia jest używana np. W Wprowadzenie do ekonometrii, wydanie trzecie. autorzy James H. Stock i Mark W. Watson, str. 281; oraz Analiza ekonometryczna danych przekroju i panelu, wyd. 1. autor: Jeffrey M. Wooldridge, str. 607. Zobacz także warunkowe ograniczenia niezależności: testowanie i szacowanie dla podobnych dyskusji.
DODATKOWE MYŚLI I ZAPYTANIA 2
Myślę, że w przeciwieństwie do Jamesa H. Stocka i Marka W. Watsona, warunkowa niezależność nie zapewnia obiektywnej oceny OLS na poziomie . Wynika to z faktu, że może przyjmować formy nieliniowe, takie jak gdzie jest wielomianem w , lub gdzie jest jakimś parametrem, który należy jeszcze oszacować (tutaj używam macierzy wykładniczej ), a następnie, jak sądzę, należy zastosować regresję nieliniową , co na ogół pozostawia nam tendencyjne oszacowania. Ponadto oszacowanie OLS w (1) może nawet nie pokrywać się z oszacowaniem OLSw jeśli przyjmuje pewne formy nieliniowe. (Psychologicznie uważam również, że stwierdzenie zawarte w książce Stock & Watson jest zbyt piękne, aby mogło być prawdziwe.)
Zatem dodatkowym pytaniem jest, czy istnieje jakiś kontrprzykład na twierdzenie, że warunkowa średnia niezależność prowadzi do obiektywnego oszacowania OLS?
SUBQUERY 3
W Przeważnie Nieszkodliwych Ekonometrii Angrist i Pischke argumentują w podrozdziale 3.3, s. 1. 68--91, że w warunkach warunkowej niezależności (CI), tj. jest niezależny od biorąc pod uwagę (co, jak sądzę, jest to silniejszy warunek niż podane powyżej warunkowe założenie średniej niezależności), istnieje ścisły związek między dopasowanymi szacunkami wpływ na i współczynników na w regresji na i który motywuje, że w CI estymacja OLS współczynnika na w jest mniej stronniczy niż wtedy, gdy CI się nie utrzymuje (wszystkie pozostałe są równe).
Czy ten pomysł można w jakiś sposób wykorzystać do odpowiedzi na moje główne pytanie tutaj?