Jak intuicyjnie rozumieć SARIMAX?


27

Próbuję zrozumieć artykuł na temat prognozowania obciążenia elektrycznego, ale walczę z zawartymi w nim koncepcjami, zwłaszcza modelem SARIMAX . Ten model służy do przewidywania obciążenia i wykorzystuje wiele pojęć statystycznych, których nie rozumiem (jestem studentem informatyki na studiach licencjackich - możesz uznać mnie za laika w statystyce). Nie muszę całkowicie rozumieć, jak to działa, ale chciałbym przynajmniej intuicyjnie zrozumieć, co się dzieje.

Próbowałem podzielić SARIMAX na mniejsze części i próbować zrozumieć każdy z tych elementów osobno, a następnie złożyć je razem. Czy możecie mi pomóc? Oto co mam do tej pory.

Zacząłem od AR i MA.

AR : Autoregresja . Nauczyłem się, czym jest regresja, i z mojego zrozumienia wynika po prostu odpowiedź na pytanie: biorąc pod uwagę zestaw wartości / punktów, jak mogę znaleźć model, który wyjaśnia te wartości? Mamy więc na przykład regresję liniową, która próbuje znaleźć linię, która może wyjaśnić wszystkie te punkty. Autoregresja to regresja, która próbuje wyjaśnić wartości na podstawie ich poprzednich wartości.

MA : Średnia ruchoma . Właściwie jestem tutaj całkiem zagubiony. Wiem, czym jest średnia ruchoma, ale model średniej ruchomej nie wydaje się mieć nic wspólnego z „normalną” średnią ruchomą. Formuła modelu wydaje się niezręcznie podobna do AR i wydaje mi się, że nie rozumiem żadnej z koncepcji, które znajduję w Internecie. Jaki jest cel MA? Jaka jest różnica między MA a AR?

Więc teraz mamy ARiMR. Następnie I pochodzi ze zintegrowanego , który, o ile rozumiem, służy po prostu temu, aby pozwolić modelowi ARMA mieć tendencję, albo zwiększającą się, albo malejącą. (Czy to równoznaczne z powiedzeniem ARIMA pozwala na niestacjonarność?)

Teraz pojawia się S od sezonu , co dodaje okresowości do ARIMA, co w zasadzie mówi, na przykład w przypadku prognozowania obciążenia, że ​​obciążenie wygląda bardzo podobnie codziennie o 18:00.

Wreszcie X , od zmiennych egzogenicznych , co w zasadzie pozwala na uwzględnienie zmiennych zewnętrznych w modelu, takich jak prognozy pogody.

W końcu mamy SARIMAX! Czy moje wyjaśnienia są w porządku? Uznaj, że te wyjaśnienia nie muszą być ściśle poprawne. Czy ktoś może mi wyjaśnić, co MA robi intuicyjnie?


6
Twoja intuicja, że model średniej ruchomej wydaje się nie mieć nic wspólnego z „normalną” średnią ruchomą, to dźwięk. Zobacz na przykład: Dlaczego modele szeregów czasowych MA (q) nazywane są „średnimi ruchomymi”?
Graeme Walsh,

Odpowiedzi:


15

Jak można zauważyć, (1) model AR odnosi wartość obserwacji w czasie t do poprzednich wartości, z pewnym błędem: x t = φ x t - 1 + ε t substytut Let w x t -xt

xt=ϕxt1+εt
, a następnie x t - 2 : x txt1xt2 Biorąc to w nieskończoność: xt=ϕnxt-n+ϕn-1εt-n+1+. . . +ϕεt-1+εt
xt=ϕ(ϕxt2+εt1)+εt=ϕ2xt2+ϕεt1+εt=ϕ3xt3+ϕ2εt2+ϕεt1+εt
xt=ϕnxtn+ϕn1εtn+1+...+ϕεt1+εt
Możesz napisać dowolne (stacjonarne) AR ( ) jako MA ( ), choć oczywiście natrafisz na gigantyczne stosy terminów jeden na drugim z p > 1 .pp>1

Widząc to, przepiszmy teraz naszą definicję (1). Proces AR wiąże wartość obserwacji w czasie t z nieskończoną sekwencją zanikających szoków błędów ε z poprzednich okresów czasu (których nie obserwujemy bezpośrednio).xt ε

Więc czym jest proces MA może być teraz jaśniejszy. (2) Proces MA ( ) wiąże wartość obserwacji x w czasie t z tylko q wyładowaniami błęduqxtq poprzednich okresów (które nie są bezpośrednio zaobserwować), których współczynniki mogą różnić się więcej niż wykładniczy zanik ukryte w modelu AR. Jak zauważyłeś, nie ma to nic wspólnego ze zwykłą koncepcją „średniej ruchomej”.

θ1...θqqqxtx

xtxtxt1


Cześć Affine, dziękuję za szybką odpowiedź! Czy mogę powiedzieć, że MA jest jak AR dla błędu?
Clash,

pq
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.