Ta odpowiedź podkreśla weryfikowalność. Właściwość minimalnej wariancji należy do mojej drugiej uwagi.
Na początek podsumuj informacje dotyczące formy macierzowej modelu liniowego w następujący sposób:
gdzie (aby omówić oszacowanie, założenie sferyczności nie jest konieczne. Ale aby omówić właściwość Gaussa-Markowa, musimy założyć kulistość ). E(
Y:=⎡⎣⎢⎢⎢Y1Y2Y3Y4⎤⎦⎥⎥⎥=⎡⎣⎢⎢⎢1111010−1−1−1−1−1⎤⎦⎥⎥⎥⎡⎣⎢θ1θ2θ3⎤⎦⎥+⎡⎣⎢⎢⎢ε1ε2ε3ε4⎤⎦⎥⎥⎥:=Xβ+ε,(1)
εE(ε)=0,Var(ε)=σ2Iε
Jeśli macierz projektowa ma pełną rangę, to parametr początkowy dopuszcza unikalne oszacowanie najmniejszych kwadratów . W związku z tym dowolny parametr , zdefiniowany jako funkcja liniowa z , można oszacować w tym sensie, że można go jednoznacznie oszacować na podstawie danych za pomocą oszacowania metodą najmniejszych kwadratów as .β β = ( X ' X ) - 1 X " Y cp cp ( β ) β β cp = P ' βXββ^=(X′X)−1X′Yϕϕ(β)ββ^ϕ^=p′β^
Subtelność powstaje, gdy nie ma pełnej rangi. Aby przeprowadzić dokładną dyskusję, najpierw naprawiamy niektóre zapisy i terminy (przestrzegam konwencji „Podejście bez współrzędnych do modeli liniowych” , punkt 4.8. Niektóre z tych terminów brzmią niepotrzebnie technicznie). Ponadto dyskusja dotyczy ogólnego modelu liniowego z i .Y = X β + ε X ∈ R n × k β ∈ R kXY=Xβ+εX∈Rn×kβ∈Rk
- Kolektora regresji jest zbiorem wektorów jako średnią zmienia się w :
R k M = { X β : β ∈ R k } .βRk
M={Xβ:β∈Rk}.
- Funkcja parametryczna jest liniową funkcją ,
β ϕ ( β ) = p ′ β = p 1 β 1 + ⋯ + p k β k .ϕ=ϕ(β)β
ϕ(β)=p′β=p1β1+⋯+pkβk.
Jak wspomniano powyżej, gdy , nie każda funkcja parametryczna jest możliwa do oszacowania. Ale poczekaj, jaka jest definicja terminu możliwa do oszacowania pod względem technicznym? Trudno podać jasną definicję bez zawracania głowy algebrą liniową. Jedna z definicji, która moim zdaniem jest najbardziej intuicyjna, jest następująca (z tego samego wyżej wspomnianego odniesienia):ϕ ( β )rank(X)<kϕ(β)
Definicja 1. Funkcjonalność parametrycznąmożna oszacować, jeśli jest jednoznacznie określona przezw tym sensie, żeza każdym razem, gdyspełniają.X β ϕ ( β 1 ) = ϕ ( β 2 ) β 1 , β 2 ∈ R k X β 1 = X β 2ϕ(β)Xβϕ(β1)=ϕ(β2)β1,β2∈RkXβ1=Xβ2
Interpretacja. Z powyższej definicji wynika, że mapowanie z kolektora regresji do przestrzeni parametrów musi być jeden do jednego, co jest gwarantowane, gdy (tj. Gdy sam jest jeden- do jednego). Kiedy , wiemy, że istnieją takie, że . Powyższa możliwa do oszacowania definicja wyklucza te funkcjonalne parametryczne z defektem strukturalnym, które same w sobie dają różne wartości, nawet przy tej samej wartości na , co nie ma naturalnego sensu. Z drugiej strony, przewidywalna funkcja parametrycznaRanga M ϕ ( X ) = k Ranga X ( X ) < k β 1 ≠ β 2 X β 1 = X β 2 M ϕ ( ⋅ ) ϕ ( β 1 ) = ϕ ( β 2 ) β 1 ≠ β 2 X β 1 = X β 2Mϕrank(X)=kXrank(X)<kβ1≠β2Xβ1=Xβ2Mϕ(⋅)zezwala na wielkość liter z , o ile warunek jest spełniony.ϕ(β1)=ϕ(β2)β1≠β2Xβ1=Xβ2
Istnieją inne równoważne warunki, aby sprawdzić estymację funkcji parametrycznej podanej w tym samym odnośniku, Twierdzenie 8.4.
Po tak pełnym wprowadzeniu w tło wróćmy do twojego pytania.
A. Samego nie się z tego powodu, że , co pociąga za sobą z . Chociaż powyższa definicja jest podana dla funkcjonałów skalarnych, łatwo można ją uogólnić na funkcjonały o wartości wektorowej.ranga ( X ) < 3 X β 1 = X β 2 β 1 ≠ β 2βrank(X)<3Xβ1=Xβ2β1≠β2
B. jest nie do oszacowania. To , rozważmy i , co daje ale .β 1 = ( 0 , 1 , 0 ) ′ β 2 = ( 1 , 1 , 1 ) ′ X β 1 = X β 2 ϕ 1 ( β 1 ) = 0 + 0 =ϕ1(β)=θ1+θ3=(1,0,1)′ββ1=(0,1,0)′β2=(1,1,1)′Xβ1=Xβ2ϕ1(β1)=0+0=0≠ϕ1(β2)=1+1=2
C. można oszacować. Ponieważ trywialnie implikuje , tj. .X β 1 = X β 2 θ ( 1 ) 1 - θ ( 1 ) 3 = θ ( 2 ) 1 - θ ( 2 ) 3 ϕ 2 ( β 1 ) = ϕ 2ϕ2(β)=θ1−θ3=(1,0,−1)′βXβ1=Xβ2θ(1)1−θ(1)3=θ(2)1−θ(2)3ϕ2(β1)=ϕ2(β2)
D. jest również możliwe do oszacowania . z do jest również trywialne.X β 1 = X β 2 ϕ 3 ( β 1 ) = ϕ 3 ( β 2 )ϕ3(β)=θ2=(0,1,0)′βXβ1=Xβ2ϕ3(β1)=ϕ3(β2)
Po zweryfikowaniu oszacowania istnieje twierdzenie (Twierdzenie 8.16, to samo odniesienie) twierdzi, że właściwość Gaussa-Markowa dla . Na podstawie tego twierdzenia druga część opcji C jest niepoprawna. Najlepsze liniowe oszacowanie bezstronne to , zgodnie z poniższym twierdzeniem.ˉ Y = ( Y 1 + Y 2 + Y 3 + Y 4 ) / 4ϕ(β)Y¯=(Y1+Y2+Y3+Y4)/4
Twierdzenie. Niechbędzie możliwą do oszacowania funkcją parametryczną, wtedy jego najlepszym liniowym obiektywnym oszacowaniem (aka, oszacowanie Gaussa-Markowa) jestdla dowolnego rozwiązaniado normalnych równań.φ ( β ) β X ' X β = X ' Yϕ(β)=p′βϕ(β^)β^X′Xβ^=X′Y
Dowód jest następujący:
Dowód. Proste obliczenia pokazują, że normalne równania to
które, po uproszczeniu jest to:
tj. . [ φ ( β ) θ 2 / 2 - φ ( β ) ] = [ ˉ Y ( Y
⎡⎣⎢40−4020−404⎤⎦⎥β^=⎡⎣⎢10−111−110−11−1−1⎤⎦⎥Y,
⎡⎣⎢⎢ϕ(β^)θ^2/2−ϕ(β^)⎤⎦⎥⎥=⎡⎣⎢Y¯(Y2−Y4)/4−Y¯⎤⎦⎥,
ϕ(β^)=Y¯
Dlatego opcja D jest jedyną prawidłową odpowiedzią.
Dodatek: Związek szacowności i identyfikowalności
Gdy byłem w szkole, profesor krótko wspomniał, że estymacja funkcji parametrycznej odpowiada identyfikowalności modelu. Uznałem to roszczenie za oczywiste. Jednak równoważność musi być wyrażona bardziej precyzyjnie.ϕ
Według monografii AC Davisona Modele statystyczne s. 144,
Definicja 2. Model parametryczny, w którym każdy parametrgeneruje inny rozkład, nazywa się identyfikowalnym .θ
W przypadku modelu liniowego , niezależnie od warunku sferyczności , można go przeformułować jako
(1)Var(ε)=σ2I
E[Y]=Xβ,β∈Rk.(2)
Jest to model taki prosty, że tylko określone pierwszego formularza moment wektora odpowiedzi . Gdy , model jest zidentyfikowania, ponieważ oznacza (słowo „dystrybucja” w oryginalnej definicji, naturalnie sprowadza się do „oznacza „w modelu .).Yrank(X)=k(2)β1≠β2Xβ1≠Xβ2(2)
Załóżmy teraz, że i dana funkcja parametryczna , jak pogodzić definicję 1 i definicję 2 ?rank(X)<kϕ(β)=p′β
Cóż, manipulując notacjami i słowami, możemy pokazać, że („dowód” jest raczej trywialny) estymacja jest równoważna temu, że model jest identyfikowalny, gdy jest sparametryzowany parametrem (macierz projektowa prawdopodobnie się odpowiednio zmieni). Aby udowodnić, załóżmy, że można oszacować, więc oznacza , z definicji jest to , stąd model jest zidentyfikowania podczas indeksowania za pomocą . Odwrotnie, załóżmy, że model jest możliwy do zidentyfikowaniaϕ(β)(2)ϕ=ϕ(β)=p′βXϕ(β)Xβ1=Xβ2p′β1=p′β2ϕ1=ϕ2(3)ϕ(3)Xβ1=Xβ2 oznacza , co jest trywialnie .ϕ1=ϕ2ϕ1(β)=ϕ2(β)
Intuicyjnie, gdy ma zmniejszoną pozycję w rankingu, model z jest redundantny (zbyt wiele parametrów), dlatego możliwa jest nie redundantna niższa wymiarowa reparametryzacja (która może składać się z zbioru funkcjonałów liniowych). Kiedy taka nowa reprezentacja jest możliwa? Kluczem jest oszacowanie.Xβ
Aby zilustrować powyższe stwierdzenia, zastanówmy się ponownie nad twoim przykładem. że parametryczne funkcjonały i są możliwe do . Dlatego możemy przepisać model pod względem parametru reparametryzowanego w następujący sposób
ϕ2(β)=θ1−θ3ϕ3(β)=θ2(1)(ϕ2,ϕ3)′
E[Y]=⎡⎣⎢⎢⎢1111010−1⎤⎦⎥⎥⎥[ϕ2ϕ3]=X~γ.
Oczywiście, ponieważ ma pełną pozycję, model z nowym parametrem jest zidentyfikowania.X~γ
self-study
tag, bo ktoś przyjdzie i zamknie twoje pytanie.