W twojej notacji jest rzutem i przestrzenią kolumny , tj. Podprzestrzenią obejmującą wszystkie regresory. Dlatego jest rzutem na wszystko prostopadle do podprzestrzeni rozpiętej przez wszystkie regresory.H.XM.: =jan- H
Jeśli , to jest pojedynczo rozłożony normalnie, a elementy są skorelowane, jak pan mówi.X∈Rn × kmi^∈Rn
Błędy są niedostrzegalna i na ogół nie są prostopadłe do podprzestrzeni rozpiętej przez . Dla celów argumentu załóżmy, że błąd . Gdyby tak było, mielibyśmy z . Ponieważ , możemy rozłożyć i uzyskać true .εXrozpiętość ε ⊥( X)y= Xβ+ ε =y~+ εy~⊥ εy~= Xβ∈ zakres( X)yε
Załóżmy, że mamy bazę z , gdzie pierwszy wektor obejmuje podprzestrzeń nazwa i pozostałe span . Ogólnie rzecz biorąc, błąd będzie miał niezerowe komponenty dla . Te niezerowe komponenty zostaną pomieszane z i dlatego nie można ich odzyskać przez projekcję na .b1, ... ,bnRnb1, ... ,bkZakres( X)bk + 1, ... ,bnZakres( X)⊥ε =α1b1+ … +αnbnαjai ∈ { 1 , … , k }XβZakres( X)
Ponieważ nigdy nie możemy mieć nadziei na odzyskanie prawdziwych błędów i są skorelowane w liczbie pojedynczej wymiarowej normalnej, moglibyśmy przekształcić . Tam możemy mieć
tj. jest niepodzielną nieskorelowaną i homoscedastyczną rozkładem normalnym. Reszty nazywane są pozostałości BLUS Thiel jest .εmi^nmi^∈Rn↦mi∗∈Rn - k
mi∗∼N.n - k( 0 ,σ2)jan - k) ,
mi∗mi∗
W krótkim artykule o badaniu zaburzeń regresji dla normalności znajduje się porównanie reszt OLS i BLUS. W testowanym ustawieniu Monte Carlo reszty OLS są lepsze niż reszty BLUS. Ale to powinno dać ci punkt wyjścia.