Jak uwzględnić wpływ prognozowanych świąt

Mam dość przewidywalne dzienne szeregi czasowe z tygodniową sezonowością. Jestem w stanie wymyślić prognozy, które wydają się dość dokładne (potwierdzone przez krzyżową weryfikację), gdy nie ma wakacji. Jednak gdy są święta, mam następujące problemy:

W mojej prognozie dostaję niezerowe liczby świąt, mimo że wszystkie historyczne święta mają wartość 0. To naprawdę nie jest główny problem. Problemem jest ...
Ponieważ przetwarzanie, które nie występuje w święta, „rozlewa się” na dni następujące po świętach, prosta zmienna fikcyjna nie ogranicza tego, ponieważ te wartości odstające wydają się być krótkoterminowe innowacyjne. Gdyby nie istniała cotygodniowa sezonowość, mogłabym być może oszacować rozkład nieprzetworzonych danych z wakacji przez pięć lub więcej dni po święcie (zgodnie z sugestią w Jak utworzyć zmienne odzwierciedlające wpływ wyprzedzenia i opóźnienia w okresie wakacyjnym / efekty kalendarza w analizie szeregów czasowych? ). Jednak rozkład „rozlewania” zależy od dnia tygodnia, w którym ma miejsce święto, oraz od tego, czy święto to Boże Narodzenie czy Święto Dziękczynienia, gdzie zamówienia są składane w niższej stawce niż przez resztę roku.

Oto kilka migawek z mojej krzyżowej weryfikacji, które pokazują przewidywany (niebieski) w porównaniu do rzeczywistego (czerwony) wynik dla świąt, które pojawiają się w różne dni tygodnia:

Martwię się również, że wpływ świąt Bożego Narodzenia zależy od dnia tygodnia, w który przypada, i mam tylko sześć lat danych historycznych.

Czy ktoś ma jakieś sugestie, jak radzić sobie z tego rodzaju innowacyjnymi wartościami odstającymi w kontekście prognoz? (Niestety nie mogę udostępnić żadnych danych)

— Julia Maddalena
źródło

Też mnie to bardzo interesuje.

— EngrStudent

Jeśli nie możesz opublikować swoich danych, to może mógłbyś opublikować gotowe dane, które są podobne do twoich danych? W wielu przypadkach ułatwia to bardziej trafne odpowiedzi.

— Tim

Skaluj dane. Model będzie taki sam (tylko skalowany). Możesz nawet przeskalować prognozy z powrotem do pierwotnych danych.

— Tom Reilly,

Czy nie można utworzyć zmiennej zastępczej na wakacje, jednej na wakacje + 1 i jednej na wakacje + 2 i ustawić je tylko na 1, o ile przypadają one w dzień powszedni?

Jeśli chodzi o Święto Dziękczynienia i Boże Narodzenie, wprowadzenie najróżniejszych zmiennych na te święta wydaje się być najgorszym rozwiązaniem (ponieważ masz tylko sześć lat danych). Do pewnego stopnia może to być twoja jedyna opcja - ludzie po prostu zachowują się inaczej w te święta niż, powiedzmy, w czwartek lipca (a jeśli studiujesz np. Wzorce sprzedaży detalicznej, to zdecydowanie musisz po prostu z nimi żyć) są to „specjalne” wakacje i zdecydowanie chciałbym je przeanalizować osobno). Być może jednak poniższe pomysły są dla Ciebie pomocne:

Święto Dziękczynienia. Czy fakt, że zawsze przypada na ten sam dzień tygodnia (czwartek), nie powinien ułatwić? Tzn. Manekin na Święto Dziękczynienia może być wykonalny nawet w sześcioletnim zestawie danych, ponieważ wzorzec dnia tygodnia zawsze będzie taki sam.
Boże Narodzenie. Spoglądając na wykres, wydaje mi się, że głównym problemem jest to, że efekt utrzymuje się dłużej niż po innych świętach - jeśli zdefiniujesz „Wigilię” jako Wigilię (24 grudnia), to dlatego, że wiele osób pozostanie w domu na Boże Narodzenie (25 grudnia) (a nawet w drugi dzień świąt (26 grudnia) w niektórych miejscach). Pomyślę o tym trochę więcej.

Mam nadzieję, że to pomoże.

— Candamir
źródło