Wybór modelu Boxa-Jenkinsa

Procedura wyboru modelu Boxa-Jenkinsa w analizie szeregów czasowych rozpoczyna się od przyjrzenia się funkcjom autokorelacji i częściowej autokorelacji w serii. Te wykresy mogą sugerować odpowiednie i w modelu ARMA . Procedura jest kontynuowana, prosząc użytkownika o zastosowanie kryteriów AIC / BIC w celu wybrania najbardziej oszczędnego modelu spośród tych, które wytwarzają model z terminem błędu białego szumu. $p$ $q$ $(p,q)$

Zastanawiałem się, jak te etapy kontroli wzrokowej i wyboru modelu opartego na kryteriach wpływają na szacowane standardowe błędy ostatecznego modelu. Wiem, że wiele procedur wyszukiwania w domenie przekrojowej może na przykład odchylać standardowe błędy w dół.

W pierwszym kroku, w jaki sposób wybór odpowiedniej liczby opóźnień na podstawie danych (ACF / PACF) wpływa na standardowe błędy modeli szeregów czasowych?

Sądzę, że wybór modelu na podstawie wyników AIC / BIC miałby wpływ analogiczny do tego dla metod przekrojowych. Właściwie nie wiem zbyt wiele o tym obszarze, więc wszelkie uwagi byłyby mile widziane w tej kwestii.

Na koniec, jeśli zapisałeś dokładne kryterium zastosowane dla każdego kroku, czy możesz uruchomić cały proces, aby oszacować standardowe błędy i wyeliminować te obawy?

— Charlie
źródło

czy stronniczość w standardowych błędach (parametrów?) jest tak ważna w a-teoretycznych modelach ARMA? Modele ARMA ASFAIK są wykorzystywane głównie do prognoz krótkoterminowych. Problemy z interpretacją parametrów i ich właściwościami są mniej (najmniej?) Ważne. Oczywiście, jeśli nie masz na myśli cech procesu innowacyjnego (błąd), planujesz stworzyć odpowiednie przedziały prognozowania.

— Dmitrij Celov,

@Dmitrij, Istnieją dwa główne powody, dla których martwię się o błąd w standardowych błędach współczynników. Pierwszym, jak wspomniałeś, jest tworzenie przedziałów prognozowania. Drugi to testowanie pęknięć strukturalnych w modelu, wspólne pytanie, na które ekonomista byłby zainteresowany odpowiedzią. Standardowe błędy generowane przy użyciu procedury wyboru powinny być zbyt małe, dając zbyt wąskie przedziały prognozowania i zbyt duże statystyki testowania.

— Charlie,

ale w modelach teoretycznych (co oznacza, że nie ma teorii, nie ma struktury), pęknięcia strukturalne mają niewiele wspólnego z parametrami, które byłyby to pewne ogólne testy, dotyczące zachowania reszt modelu. W tym przypadku obiektywne szacunki parametrów modeli są mniej ważne, ARiMR po prostu nie ma interpretacji modeli strukturalnych. Zatem modele oszczędne są rzeczywiście lepszymi predyktorami, ponieważ dobrze równoważą zwykle słabe właściwości estymatorów małych próbek i dokładność prognoz.

— Dmitrij Celov,

Zauważ, że nawet jeśli znasz proces generowania danych, który ma wiele parametrów, w małych próbkach prostszy model prawdopodobnie wykona lepsze przewidywania, ale w kontekście strukturalnym parametry takiego modelu będą bardzo stronnicze (pomijane zmienne odchylenie)!

— Dmitrij Celov,

Odpowiedzi:

Każda procedura wyboru modelu wpłynie na standardowe błędy i rzadko jest to brane pod uwagę. Na przykład przedziały prognozowania są obliczane warunkowo na modelu szacunkowym, a estymacja parametrów i wybór modelu są zwykle ignorowane.

Powinna istnieć możliwość przeładowania całej procedury w celu oszacowania efektu procesu wyboru modelu. Pamiętaj jednak, że ładowanie szeregów czasowych jest trudniejsze niż normalne ładowanie, ponieważ musisz zachować korelację szeregową. Blokowanie ładowania jest jednym z możliwych podejść, chociaż traci pewną korelację szeregową z powodu struktury bloku.

— Rob Hyndman
źródło

Moim zdaniem wybór odpowiedniej liczby opóźnień nie różni się niczym od wyboru szeregu wejściowego w procedurze regresji krokowej do przodu. Przyrostowe znaczenie opóźnień lub określonej serii danych wejściowych stanowi podstawę specyfikacji modelu tymczasowego.

Ponieważ stwierdziłeś, że acf / pacf jest jedyną podstawą do wyboru modelu Boxa-Jenkinsa, powiem ci, czego nauczyło mnie pewne doświadczenie. Jeśli seria wykazuje acf, który nie ulega rozkładowi, podejście Boxa-Jenkinsa (około 1965 r.) Sugeruje różnicowanie danych. Ale jeśli seria ma przesunięcie poziomu, takie jak dane Nilu , to „widoczna” niestacjonarność jest objawem potrzebnej struktury, ale różnicowanie nie jest rozwiązaniem. Ten zestaw danych Nilu można modelować bez różnicowania, po prostu identyfikując najpierw potrzebę przesunięcia poziomu. W podobny sposób uczymy się, używając 1960 koncepcji, że jeśli acf wykazuje strukturę sezonową ( tjznaczące wartości przy opóźnieniach s, 2s, 3s, ...), wówczas powinniśmy uwzględnić sezonowy składnik ARIMA. Do celów dyskusji rozważ serię, która jest stacjonarna wokół średniej, aw ustalonych odstępach czasu, powiedz, że w czerwcu jest „wysoka wartość”. Ta seria jest odpowiednio traktowana poprzez włączenie „staromodnej” serii manekinów 0 i 1 (w czerwcu) w celu potraktowania struktury sezonowej. Sezonowy model ARIMA niepoprawnie używałby pamięci zamiast nieokreślonej, ale czekającej na znalezienie zmiennej X. Te dwie koncepcje identyfikowania / włączania nieokreślonej deterministycznej struktury są bezpośrednimi zastosowaniami pracy I. Changa, Williama Bella, George'a Tiao, R. Tsaya , Chen i in. (Począwszy od 1978 r.) W ramach ogólnej koncepcji wykrywania interwencji.

Nawet dzisiaj niektórzy analitycy bezmyślnie realizują strategie maksymalizacji pamięci, nazywając je Automatic ARIMA, nie uznając, że „bezmyślne modelowanie pamięci” zakłada, że deterministyczna struktura, taka jak impulsy, przesunięcia poziomów, pulsacje sezonowe i trendy czasu lokalnego nie istnieją lub są gorsze, ale nie grają rola w identyfikacji modelu. Jest to podobne do wkładania głowy w piasek, IMHO.

— IrishStat
źródło

Dzięki za doskonałą poradę na temat wyboru modelu, ale byłem zainteresowany tym, jak ten proces wpływa na nasze wnioskowanie.

— Charlie,

Charlie: Nie wierzę, że diagistyka danych z góry, taka jak przegląd autokorelacji lub korelacji krzyżowych lub jakakolwiek inna procedura identyfikacji modelu, taka jak prezentacja graficzna, ma jakikolwiek wpływ na istotność statystyczną jakichkolwiek oszacowanych parametrów. To moja opinia i „oto stoję, nie mogę zrobić nic innego”. Dzięki za uznanie i jeśli mogę w jakikolwiek sposób pomóc młodemu Charliem, proszę się ze mną skontaktować, ponieważ uwielbiam być wymieniony jako źródło wsparcia (nieopłacone!) W rozprawach doktorskich.

— IrishStat