Jest dobrze ustalone, przynajmniej wśród statystyków pewnego wyższego kalibru, że modele z wartościami statystyki AIC mieszczącymi się w pewnym progu wartości minimalnej należy uznać za odpowiednie jako model minimalizujący statystyki AIC. Na przykład w [1, s. 221] znajdujemy
Wtedy modele z małym GCV lub AIC będą uważane za najlepsze. Oczywiście nie należy ślepo minimalizować GCV lub AIC. Wszystkie modele o względnie małych wartościach GCV lub AIC należy raczej uznać za potencjalnie odpowiednie i ocenione zgodnie z ich prostotą i przydatnością naukową.
Podobnie w [2, s.144] mamy
Sugerowano (Duong, 1984), że modele o wartościach AIC mieszczących się w granicach c wartości minimalnej należy uznać za konkurencyjne (przy wartości c = 2 jako wartości typowej). Wybór spośród modeli konkurencyjnych może wówczas opierać się na takich czynnikach, jak biel reszt (sekcja 5.3) i prostota modelu.
Bibliografia:
- Ruppert, D .; Wand, MP & Carrol, RJ Semiparametric Regression , Cambridge University Press, 2003
- Brockwell, PJ & Davis, RA Wprowadzenie do szeregów czasowych i prognoz , John Wiley & Sons, 1996
Biorąc powyższe pod uwagę, który z dwóch poniższych modeli powinien być preferowany?
print( lh300 <- arima(lh, order=c(3,0,0)) )
# ... sigma^2 estimated as 0.1787: log likelihood = -27.09, aic = 64.18
print( lh100 <- arima(lh, order=c(1,0,0)) )
# ... sigma^2 estimated as 0.1975: log likelihood = -29.38, aic = 64.76
Mówiąc bardziej ogólnie, kiedy właściwe jest wybieranie modeli poprzez ślepe minimalizowanie AIC lub powiązanych statystyk?