Czym dokładnie jest metoda Box-Jenkins dla procesów ARIMA?


10

Strona Wikipedii mówi, że Box-Jenkins to metoda dopasowania modelu ARIMA do szeregu czasowego. Teraz, jeśli chcę dopasować model ARIMA do szeregu czasowego, otworzę SAS, zadzwonię proc ARIMA, podam parametry a SAS da mi współczynniki AR i MA. Teraz mogę wypróbować różne kombinacje a SAS da mi zestaw współczynników w każdym przypadku. Wybieram zestaw z najniższym kryterium informacyjnym Akaike.p,d,qp,d,q

Moje pytanie brzmi: gdzie w powyższej procedurze zastosowałem Box-Jenkins? Czy powinienem użyć Box-Jenkinsa, aby uzyskać wstępne szacunki ? A może SAS użył go w jakiś sposób wewnętrznie?p,d,q

Odpowiedzi:


10

Box i Jenkins sami nie korzystali z AIC. Ich książka ukazała się w 1970 roku w oparciu o opracowaną wcześniej metodologię, a artykuły Akaike na temat AIC pojawiły się (niedługo) po opublikowaniu książki.

Ich metodologia została nakreślona w ich książce [1], ale to, co dziś obejmuje płaszcz „Box-Jenkins”, jest nieco szersze i różni się w zależności od osoby.

Box i Jenkins sami przedstawiają prosty schemat blokowy identyfikacji modelu, który można uznać za przydatne podsumowanie procesu zastosowanego do identyfikacji modeli. (Proponuję zajrzeć do książki, jeśli możesz - większość porządnych bibliotek uniwersyteckich powinna mieć kopię.)

Obejmowały one etapy identyfikacji, szacowania i sprawdzania / weryfikacji diagnostycznej modelu (w tym powrót do pierwszego etapu, jeśli model jest nieodpowiedni), a następnie po zidentyfikowaniu odpowiedniego modelu można prognozować model.

Strona wikipedia tutaj zawiera zarys tego, co się w to angażuje, ale zawiera wiele rzeczy, które zostały dodane do tego, co ludzie robią, odkąd ukazała się książka. Rzeczywiście, wiele dokumentów opisujących obecnie metodologię Boxa-Jenkinsa zawierałoby użycie AIC lub podobnych ilości.

Zobacz także dyskusję tutaj .

Nowsze książki (np. Patrz powyższa strona wikipedii) przedstawiają bardziej „nowoczesną” wersję ogólnego podejścia.

Na koniec, jeśli chcesz dowiedzieć się, czym tak naprawdę jest „metoda Box-Jenkinsa”, powiedziałbym „zacznij od ich książki”. W przeciwnym razie wiele nowszych modeli modeli ARIMA obejmuje zasadniczo podobną metodologię - wypróbuj dowolną liczbę rozsądnie przyzwoitych książek z serii czasowych, które obejmują modele ARIMA.

[1]: Box, George; Jenkins, Gwilym (1970),
Analiza szeregów czasowych: Prognozowanie i kontrola
San Francisco: Holden-Day


10

Metodologia Box-Jenkins to strategia lub procedura, którą można wykorzystać do zbudowania modelu ARIMA. Metodologię opisano w książce Time Series Analysis: Forecasting and Control autorstwa George EP Box i Gwilym M. Jenkins, pierwotnie opublikowanej w 1970 r. - istnieją nowsze wersje.

Otwierając SAS, wywołując proc ARIMA i podając numery p, d i q, oszacowałeś tylko model ARIMA. Robienie tego na ślepo, to znaczy nie stosowanie żadnej konkretnej uznanej metodologii do identyfikacji samego modelu ARIMA, przypomina trochę grę z zapałkami - niebezpieczeństwa związane z oprogramowaniem!

Jeśli będziesz powtarzać ten proces - szacując wiele modeli ARIMA - w końcu będziesz mógł wybrać model z najniższym kryterium Informacji Akaike (z zestawu modeli, które oszacowałeś). W tym kontekście bardziej systematyczne podejście polegałoby na zastosowaniu algorytmu opartego na porównaniu wartości AIC dla różnych modeli, aby automatycznie wybrać model ARIMA dla ciebie, taki jak ten dostarczony przez pakiet prognozy w R - nazwa odpowiedniej funkcji jest auto.arima().

W każdym razie opisana przez ciebie procedura obejmowała wybór modelu ARIMA w oparciu o zminimalizowanie pewnego kryterium informacyjnego (w tym przypadku AIC, ale istnieją inne miary). Jest to jedna szczególna metodologia, ale nie jest to metodologia Boxa-Jenkinsa; alternatywa.

Metodologia Boxa-Jenkinsa składa się z pięciu etapów (choć czasami mówi się, że obejmują tylko trzy etapy):

  1. Sprawdzanie stacjonarności lub niestacjonarności i przekształcanie danych, jeśli to konieczne;
  2. Identyfikacja odpowiedniego modelu ARMA;
  3. Oszacowanie parametrów wybranego modelu;
  4. Kontrola diagnostyczna adekwatności modelu; i
  5. Prognozowanie lub powtórzenie kroków od drugiego do piątego.

W szczególności jest to proces iteracyjny, w którym konstruktor modeli dokonuje pewnej oceny - i jest to jeden aspekt metodologii, który uznano za wadę. Część osądowa ma znaczenie, szczególnie przy interpretacji dwóch narzędzi; mianowicie (szacunkowa) funkcja autokorelacji (ACF) i funkcja częściowej autokorelacji (PACF).

Jeśli chcesz zostać praktykiem metodologii Boxa-Jenkinsa, zaleciłbym zapoznanie się z oryginalnym tekstem (zdziwiłbyś się, co pomijają współczesne podręczniki!) Obok wszelkich nowoczesnych odmian, jakie możesz znaleźć. Alan Pankratz ma kilka doskonałych podręczników, które również bardzo polecam; na przykład Prognozowanie za pomocą Univariate Box-Jenkins Models: Concepts and Cases .

Doświadczenie sugeruje mi, że termin „metodologia Boxa-Jenkinsa” jest używany w luźny sposób, ponieważ słyszałem, że niektórzy ludzie używają go do zwykłego odniesienia do budowy modeli ARIMA w ogóle - a nie do rzeczywistego procesu związanego z budowaniem modelu ARIMA - podczas gdy inni używają go w odniesieniu do zmodyfikowanej wersji tego, co zostało opublikowane w 1970 roku. Jak zauważył @Glen_b, „istnieje wiele dokumentów opisujących metodologię Boxa-Jenkinsa, które obejmowałyby użycie AIC lub podobnych ilości” .

P: Czy powinieneś użyć metodologii Boxa-Jenkinsa, aby uzyskać wstępne szacunki p, d, q?

Jak już wspomniano, istnieją różne strategie wyboru modelu, więc odpowiedź brzmi: nie, niekoniecznie jest tak, że musisz zastosować metodologię Box-Jenkins, ale możesz, jeśli chcesz.

P: Czy SAS użył go w jakiś sposób wewnętrznie?

Bardzo mało prawdopodobne, chyba że oprogramowanie to oferuje dość wyrafinowaną funkcję! Zapoznaj się z oficjalną dokumentacją SAS, aby uzyskać szczegółowe informacje na temat działania lub możliwości oprogramowania. Gdyby to był R, mógłbyś spojrzeć na kod źródłowy, ale wątpię, żeby była to opcja z SAS.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.