Oszacuj współczynniki ARMA na podstawie kontroli ACF i PACF

Jak oceniasz odpowiedni model prognozy dla szeregów czasowych poprzez wizualną kontrolę wykresów ACF i PACF? Który z nich (tj. ACF lub PACF) informuje AR lub IZ (czy też oba)? Która część wykresów pokazuje sezonową i niesezonową część sezonowego ARIMA?

Rozważ funkcje ACF i PCF przedstawione poniżej. Są z dziennika przekształcone serii, który został differenced dwukrotnie, różnica jednego prostego i jednego sezonowych ( oryginalnych danych , log przekształconych danych ). Jak opisałbyś ten serial? Jaki model najlepiej do niego pasuje?

wprowadź opis zdjęcia tutaj

r time-series forecasting acf-pacf

— 4everlearning
źródło

Odpowiedzi:

Moja odpowiedź jest tak naprawdę skrótem javlacelle, ale jest za długa na prosty komentarz, ale nie za krótka, aby była bezużyteczna.

Chociaż odpowiedź jvlacelle jest technicznie poprawna na jednym poziomie, „nadmiernie upraszcza”, ponieważ opiera się na pewnych „rzeczach”, które zwykle nigdy nie są prawdziwe. Zakłada się, że nie jest wymagana struktura deterministyczna, taka jak jeden lub więcej trendów czasowych LUB jedno lub więcej przesunięć poziomu lub jeden lub więcej impulsów sezonowych lub jeden lub więcej impulsów jednorazowych. Ponadto zakłada się, że parametry zidentyfikowanego modelu są niezmienne w czasie, a proces błędu leżący u podstaw wstępnie zidentyfikowanego modelu jest również niezmienny w czasie. Ignorowanie któregokolwiek z powyższych jest często (zawsze moim zdaniem!) Przepisem na katastrofę, a ściślej „źle zidentyfikowanym modelem”. Klasycznym tego przykładem jest niepotrzebna transformacja logarytmiczna zaproponowana dla serii linii lotniczych i serii przedstawionych przez OP w jego zmienionym pytaniu. Nie ma potrzeby jakiejkolwiek transformacji logarytmicznej dla jego danych, ponieważ istnieje tylko kilka „niezwykłych” wartości w okresach 198,207,218,219 i 256, które nieleczone powodują fałszywe wrażenie, że istnieje większa wariancja błędu z wyższymi poziomami. Zwróć uwagę, że „nietypowe wartości” są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie . Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. Nieleczone 219 i 256 powodują fałszywe wrażenie, że istnieje wyższa wariancja błędu przy wyższych poziomach. Zwróć uwagę, że „nietypowe wartości” są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie . Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. Nieleczone 219 i 256 powodują fałszywe wrażenie, że istnieje wyższa wariancja błędu przy wyższych poziomach. Zwróć uwagę, że „nietypowe wartości” są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie . Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie. Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. są identyfikowane z uwzględnieniem każdej potrzebnej struktury ARIMA, która często ucieka ludzkiemu oku. Transformacje są potrzebne, gdy wariancja błędu nie jest stała w czasie, NIE, gdy wariancja obserwowanego Y nie jest stała w czasie. Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń. Prymitywne procedury wciąż popełniają błąd taktyczny polegający na przedwczesnym wyborze transformacji przed dowolnym z wyżej wymienionych środków zaradczych. Trzeba pamiętać, że prosta strategia identyfikacji modelu ARIMA została opracowana na początku lat 60. ALE od tego czasu wprowadzono wiele zmian / ulepszeń.

Edytowane po opublikowaniu danych:

Rozsądny model został zidentyfikowany przy użyciu strony http://www.autobox.com/cms/, która jest oprogramowaniem zawierającym niektóre z moich wyżej wymienionych pomysłów, które pomogłem opracować. wprowadź opis zdjęcia tutaj Test Chow dla stałości parametrów sugerował segmentację danych i wykorzystanie 94 ostatnich obserwacji, ponieważ parametry modelu zmieniały się w czasie. Ostatnie 94 wartości dały równanie, przy czym wszystkie współczynniki były znaczące. . Wykres reszt sugeruje rozsądne rozproszenie wprowadź opis zdjęcia tutaj z następującym ACF sugerującym losowość . Rzeczywisty i oczyszczony wykres jest podświetlony, ponieważ pokazuje subtelne, ALE znaczące wartości odstające. . Wreszcie wykres rzeczywistej, dopasowanej i prognozy podsumowuje naszą pracę WSZYSTKO BEZ PODEJMOWANIA LOGARITHMS wprowadź opis zdjęcia tutaj . Jest dobrze znane, ale często zapominane, że transformacje mocy są jak narkotyki ... nieuzasadnione użycie może ci zaszkodzić. Na koniec zauważ, że model ma AR (2), ALE nie strukturę AR (1).

— IrishStat
źródło

dlaczego nie możemy podjąć transformacji dziennika? Zobacz zestaw danych AirPassengers w R, który ma zwielokrotnioną sezonowość. Zapisanie dziennika przekształca go w addytywną sezonowość. Również jeśli nie pobieramy dzienników, zbiór danych będzie miał coraz większą wariancję, tzn. Nie będzie stacjonarny. Jak poradzić sobie z takim zestawem danych bez przeprowadzania transformacji dziennika? Czy możesz wyjaśnić?

— user2338823,

„Nie ma potrzeby jakiejkolwiek transformacji logarytmicznej dla jego danych, ponieważ istnieje tylko kilka„ niezwykłych ”wartości w okresach, które nieleczone powodują fałszywe wrażenie, że istnieje większa wariancja błędu z wyższymi poziomami”. założenie stacjonarności stałości wariancji dotyczy wariancji błędu, a nie wariancji oryginalnej serii. Oprogramowanie R nie pozwala na automatyczne rozpoznanie i włączenie anomalii. zobacz dyskusję na temat autobox.com/cms/index.php/blog na temat serii. I autobox.com/pdfs/vegas_ibf_09a.pdf

— IrishStat

Test Box-Coxa dla transformacji mocy PRZYJMUJE brak wartości odstających, dlatego może fałszywie / nieumyślnie powiązać zmieniającą się wariancję z wartością oczekiwaną, tym samym niepoprawnie sugerując potrzebę transformacji. Zobacz artykuł Tsp docplayer.net/... jednego z uczniów Boxa jako wstęp do radzenia sobie z nieleczoną ukrytą deterministyczną strukturą. Cześć jeśli nie możesz / nie poradzisz sobie z naruszeniem pierwszego momentu, po którym możesz niepoprawnie się dostosować zmiana wariancji poprzez transformację mocy lub GLS, jak wskazuje Tsay.

— IrishStat,

Aby wyjaśnić koncepcje, poprzez wizualną kontrolę ACF lub PACF możesz wybrać (nie oszacować) wstępny model ARMA. Po wybraniu modelu można oszacować model, maksymalizując funkcję prawdopodobieństwa, minimalizując sumę kwadratów lub, w przypadku modelu AR, metodą momentów.

Model ARMA można wybrać po kontroli ACF i PACF. Podejście to opiera się na następujących faktach: 1) ACF stacjonarnego procesu AR rzędu p idzie do zera w tempie wykładniczym, podczas gdy PACF staje się zero po opóźnieniu p. 2) W przypadku procesu MA rzędu q teoretyczne ACF i PACF wykazują zachowanie odwrotne (ACF skraca się po opóźnieniu q, a PACF stosunkowo szybko zeruje się).

Zazwyczaj łatwo jest wykryć kolejność modelu AR lub MA. Jednak w przypadku procesów obejmujących zarówno część AR, jak i MA opóźnienie, w którym są one obcinane, może być rozmyte, ponieważ zarówno ACF, jak i PACF rozpadną się do zera.

Jednym ze sposobów postępowania jest dopasowanie najpierw modelu AR lub MA (tego, który wydaje się wyraźniejszy w ACF i PACF) niższego rzędu. Następnie, jeśli istnieje jakaś dalsza struktura, pojawi się w resztkach, więc ACF i PACF reszt są sprawdzane w celu ustalenia, czy konieczne są dodatkowe warunki AR lub MA.

Zwykle będziesz musiał spróbować zdiagnozować więcej niż jeden model. Możesz je również porównać, patrząc na AIC.

ACF i PACF, które opublikowałeś jako pierwszy, sugerowały ARiMR (2,0,0) (0,0,1), to znaczy regularne AR (2) i sezonowe MA (1). Część sezonowa modelu jest określana podobnie jak część regularna, ale z uwzględnieniem opóźnień w sezonowości (np. 12, 24, 36, ... w danych miesięcznych). Jeśli używasz R zaleca się zwiększyć domyślną liczbę opóźnień, które są wyświetlane, acf(x, lag.max = 60).

Fabuła, którą teraz wyświetlasz, ujawnia podejrzaną negatywną korelację. Jeśli ta fabuła opiera się na tym samym, co poprzednia fabuła, być może zrobiłeś zbyt wiele różnic. Zobacz także ten post .

Dalsze szczegóły można znaleźć między innymi tutaj: Rozdział 3 w Szeregach czasowych: Teoria i metody autorstwa Petera J. Brockwella i Richarda A. Davisa i tutaj .

— javlacalle
źródło

Masz rację. Mogłem wziąć jedną różnicę za dużo. Mam jednak jedną wątpliwość. Zrobiłem prostą różnicę ( i.imgur.com/1MjLzlX.png ) i sezonową (12) jeden ( i.imgur.com/E64Sd7p.png ) zarówno w danych dziennika. Na który powinienem patrzeć, sezonowy, prawda?

— 4everlearning

@ 4everlearning Właściwie, po uwzględnieniu różnic sezonowych, ACF i PACF przyglądają się bliżej tego, czego moglibyśmy oczekiwać po procesie stacjonarnym. Możesz zacząć od dopasowania ARIMA (2,0,0) (0,1,1) w R arima(x, order = c(2,0,0), seasonal = list(order = c(0,1,1)))i wyświetlenia ACF i PACF reszt. Należy również pamiętać o dalszych kwestiach poruszonych przez IrishStat, którymi należy się zająć w analizie.

— javlacalle,

Dzięki. Jak powinienem znaleźć te zamówienia AR i MA? Ponadto kryterium informacyjne Akaike daje ujemną wartość dla mojego modelu. Rozumiem, że to nie jest ważne, chociaż nie jestem pewien, jak porównać to z innymi modelami, powiedzmy AIC = -797,74 i AIC = -800,00. Który jest lepszy?

— 4everlearning

You can determine the orders following the idea given in the answer above. If you see that the ACF goes to zero relatively quickly and the PACF truncates after lag 2 then it is probably that an AR(2) structure is present in the data. The reverse idea applies to detect an MA. As a general recommendation, start with a model of low order and inspect the residuals looking for AR or MA structures to be added to the initial model.

— javlacalle

Zasadniczo im niższy AIC, tym lepszy model (przy założeniu, że używasz danych w tej samej skali w obu modelach, to znaczy, że seria powinna znajdować się w poziomach lub logach we wszystkich porównywanych modelach ).

— javlacalle,