Twierdziłbym, że przynajmniej przy omawianiu modeli liniowych (takich jak modele AR) skorygowane i AIC nie różnią się tak bardzo.R2
Zastanów się, czy powinno być uwzględnione w
Jest to równoważne z porównaniem Modele
gdzie . Mówimy, że jest prawdziwym modelem, jeśliX2
y=X1(n×K1)β1+X2(n×K2)β2+ϵ
M1M2::y=X1β1+uy=X1β1+X2β2+u,
E(u|X1,X2)=0M2β2≠0. Zauważ, że
M1⊂M2. Modele są zatem
zagnieżdżone . Procedura wyboru modelu
Mˆ jest regułą zależną od danych, która wybiera najbardziej prawdopodobny z kilku modeli.
Mówimy
Mˆjest spójny, jeśli
limn→∞P(Mˆ=M1|M1)limn→∞P(Mˆ=M2|M2)==11
Rozważ skorygowane . To znaczy wybierz jeśli . Ponieważ monotonicznie zmniejsza się , procedura ta jest równoważna zminimalizowaniu . To z kolei jest równoważne zminimalizowaniu . W przypadku wystarczająco dużego , to ostatnie można zapisać jako
gdzieR2M1R¯21>R¯22R¯2s2s2log(s2)n
log(s2)==≈≈log(σˆ2nn−K)log(σˆ2)+log(1+Kn−K)log(σˆ2)+Kn−Klog(σˆ2)+Kn,
σˆ2jest estymatorem ML wariancji błędu. Wybór modelu na podstawie jest zatem asymptotycznie równoważny wybraniu modelu z najmniejszym
. Ta procedura jest niespójna.
R¯2log(σˆ2)+K/n
Twierdzenie :
limn→∞P(R¯21>R¯22|M1)<1
Dowód :
gdzie następuje linia od drugiej do ostatniej, ponieważ statystyka jest statystyką LR w przypadku regresji liniowej, która następuje po asymptozie dystrybucja zerowa. CO BYŁO DO OKAZANIA
P(R¯21>R¯22|M1)≈=≈=→<P(log(s21)<log(s22)|M1)P(nlog(s21)<nlog(s22)|M1)P(nlog(σˆ21)+K1<nlog(σˆ22)+K1+K2|M1)P(n[log(σˆ21)−log(σˆ22)]<K2|M1)P(χ2K2<K2)1,
χ2K2
Rozważmy teraz kryterium Akaike,
Tak więc AIC wymienia również redukcję SSR sugerowaną przez dodatkowe regresory w stosunku do „kary” , ”który wskazuje w przeciwnym kierunku. Dlatego wybierz jeśli
, w przeciwnym razie wybierz .
AIC=log(σˆ2)+2Kn
M1AIC1<AIC2M2
Można zauważyć, że jest również niespójny, kontynuując powyższy dowód w wierszu trzecim z . Skorygowane i wybierają zatem „duży” model z prawdopodobieństwem dodatnim, nawet jeśli jest prawdziwym modelem.AICP(nlog(σˆ21)+2K1<nlog(σˆ22)+2(K1+K2)|M1)R2AICM2M1
Ponieważ kara za złożoność w AIC jest nieco większa niż za skorygowane , może być jednak mniej podatna na przebarwienie. I ma inne miłe właściwości (minimalizujące rozbieżność KL do prawdziwego modelu, jeśli nie ma go w rozważanym zestawie modeli), które nie są omówione w moim poście.R2