Korzystam z dziennych szeregów czasowych danych o sprzedaży, które zawierają około 2 lata codziennych punktów danych. Na podstawie niektórych samouczków / przykładów online próbowałem zidentyfikować sezonowość danych. Wydaje się, że istnieje cotygodniowa, miesięczna i prawdopodobnie roczna okresowość / sezonowość.
Na przykład są dni wypłaty, szczególnie w przypadku efektu pierwszego dnia miesiąca, który utrzymuje się przez kilka dni w tygodniu. Istnieją również pewne szczególne efekty wakacyjne, które można łatwo rozpoznać po odnotowaniu spostrzeżeń.
Wyposażony w niektóre z tych obserwacji, spróbowałem:
ARIMA (z pakietem R-prognozy
Arima
iz niegoauto.arima
), przy użyciu regresora (i innych wartości domyślnych wymaganych w funkcji). Regresor, który utworzyłem, jest w zasadzie macierzą wartości 0/1:- Zmienne 11-miesięczne (n-1)
- 12 zmiennych świątecznych
- Nie udało mi się ustalić części dotyczącej wypłaty ... ponieważ jest to trochę bardziej skomplikowany efekt, niż myślałem. Efekt wypłaty działa inaczej, w zależności od dnia tygodnia pierwszego miesiąca.
Użyłem 7 (tj. Tygodniowej częstotliwości) do modelowania szeregów czasowych. Próbowałem testu - prognozowanie 7 dni na raz. Wyniki są rozsądne: średnia dokładność dla prognozy 11 tygodni wynosi tygodniową średnią RMSE do 5%.
Model TBATS (z pakietu R-prognozy) - z wykorzystaniem wielu sezonowości (7, 30,4375, 365.25) i oczywiście bez regresora. Dokładność jest zaskakująco lepsza niż model ARIMA przy tygodniowym średnim RMSE 3,5%.
W tym przypadku model bez błędów ARMA działa nieco lepiej. Teraz, jeśli zastosuję współczynniki tylko do efektów świątecznych z modelu ARIMA opisanego w punkcie 1, do wyników modelu TBATS tygodniowa średnia RMSE poprawi się do 2,95%
Teraz, nie mając zbyt dużego zaplecza ani wiedzy na temat podstawowych teorii tych modeli, mam dylemat, czy to podejście TBATS jest w ogóle słuszne. Mimo że znacznie poprawia RMSE w teście 11 tygodni, zastanawiam się, czy może utrzymać tę dokładność w przyszłości. Lub nawet jeśli zastosowanie efektów świątecznych z ARIMA do wyniku TBATS jest uzasadnione. Wszelkie uwagi od któregokolwiek / wszystkich autorów będą mile widziane.
Uwaga: Wykonaj „Zapisz link jako”, aby pobrać plik.