Jestem pod wrażeniem forecast
pakietu R , a także np. zoo
Pakietu dla nieregularnych szeregów czasowych i interpolacji brakujących wartości.
Moja aplikacja jest w zakresie prognozowania ruchu w call center, więc danych w weekendy (prawie) zawsze brakuje (prawie), co można ładnie obsłużyć zoo
. Ponadto może brakować niektórych dyskretnych punktów, po prostu używam NA
do tego R.
Rzecz w tym: cała ładna magia pakietu prognozy, taka jak eta()
, auto.arima()
etc, zdają się oczekiwać zwykłe ts
przedmioty, czyli równo rozmieszczone szeregi czasowe nie zawierające żadnych brakujących danych. Wydaje mi się, że zastosowania w świecie rzeczywistym dla szeregów czasowych tylko zrównowaŜonych istnieją zdecydowanie, ale - moim zdaniem - bardzo ograniczone.
Problem kilku dyskretnych NA
wartości można łatwo rozwiązać za pomocą dowolnej z oferowanych funkcji interpolacji, zoo
jak również przez forecast::interp
. Następnie uruchamiam prognozę.
Moje pytania:
- Czy ktoś sugeruje lepsze rozwiązanie?
(moje główne pytanie) Przynajmniej w mojej domenie aplikacji, prognozowaniu ruchu w call center (i, o ile mogę sobie wyobrazić większość innych domen problemowych), szeregi czasowe nie są równe. Przynajmniej mamy powtarzający się program „dni roboczych” czy coś takiego. Jaki jest najlepszy sposób, aby sobie z tym poradzić i nadal używać całej fajnej magii pakietu prognozy?
Czy powinienem po prostu „skompresować” szeregi czasowe, aby wypełnić weekendy, wykonać prognozę, a następnie „napompować” dane ponownie, aby ponownie wprowadzić wartości NA w weekendy? (Myślę, że to wstyd?)
Czy są jakieś plany, aby pakiet prognozy był w pełni kompatybilny z pakietami o nieregularnych seriach czasowych, takimi jak zoo lub jego? Jeśli tak, kiedy i jeśli nie, dlaczego nie?
Jestem całkiem nowy w prognozowaniu (i statystykach w ogóle), więc mogę przeoczyć coś ważnego.
auto.arima
radzi sobie z brakującymi wartościami.