Używam modeli R (3.1.1) i ARIMA do prognozowania. Chciałbym wiedzieć, jaki powinien być parametr „częstotliwość” przypisany w ts()
funkcji , jeśli używam danych szeregów czasowych, które są:
- rozdzielone minutami i rozkładają się na 180 dni (1440 minut / dzień)
- rozdzielone sekundami i rozkładają się na 180 dni (86 400 sekund / dzień).
Jeśli dobrze pamiętam definicję, „częstotliwość” w ts w R jest liczbą obserwacji na „sezon”.
Pytanie część 1:
Jaki jest „sezon” w moim przypadku?
Jeśli sezon to „dzień”, to czy „częstotliwość” dla minut = 1440 i 86 400 dla sekund?
Pytanie część 2:
Czy „częstotliwość” może zależeć również od tego, co próbuję osiągnąć / prognozować? na przykład w moim przypadku chciałbym mieć bardzo krótkoterminową prognozę. Za każdym razem krok do przodu o 10 minut. Czy wtedy można by uznać sezon za godzinę zamiast dnia? Czy w takim przypadku częstotliwość = 60 minut, częstotliwość = 3600 sekund?
Próbowałem na przykład użyć częstotliwości = 60 dla danych minutowych i uzyskałem lepsze wyniki w porównaniu do częstotliwości = 1440 (używane fourier
patrz link poniżej przez Hyndman)
http://robjhyndman.com/hyndsight/forecasting-weekly-data/
(Porównanie przeprowadzono przy użyciu MAPE do pomiaru dokładności prognozy)
W przypadku, gdy wyniki są całkowicie arbitralne, a częstotliwości nie można zmienić. Jaka byłaby interpretacja użycia freq = 60 na moich danych?
Myślę też, że warto wspomnieć, że moje dane zawierają sezonowość co godzinę i co dwie godziny (obserwując surowe dane i funkcję autokorelacji)