Problem polega na tym, aby uzyskać równanie, które analizuje obserwowane dane na sygnał i szum. Jeśli dane są proste, podejście regresji może działać. Należy dołożyć starań, aby zrozumieć niektóre z założeń, które przyjmują z Prorokiem. Powinieneś lepiej zrozumieć, co robi Prorok, ponieważ nie tylko pasuje do prostego modelu, ale próbuje dodać jakąś strukturę.
Na przykład niektóre refleksje, które poczyniłem po przeczytaniu ich dobrze napisanego wprowadzenia, mogą pomóc w ocenie. Z góry przepraszam, jeśli źle zrozumiałem ich podejście, i jeśli tak, to chciałbym je poprawić.
1) Ich wiodący przykład ma dwa punkty wytrzymałości, ale zdobył tylko najbardziej oczywisty.
2) Ignorują każdą strukturę ARIMA odzwierciedlającą pominięte szeregi stochastyczne lub wartość wykorzystania historycznych wartości Y do kierowania prognozą.
3) Ignorują wszelkie możliwe dynamiki (efekty ołowiu i opóźnienia) sugerowanych przez użytkownika szeregów stochastycznych i deterministycznych. Skutki regresji przyczynowej proroka są po prostu współczesne.
4) Nie podejmuje się próby zmiany skoków / poziomów w pulsach szeregowych lub sezonowych, np. Zmiany EFEKTU PONIEDZIAŁKOWEGO w połowie czasu z powodu nieznanego zdarzenia zewnętrznego. Prorok zakłada „prosty wzrost liniowy”, a nie walidację go poprzez badanie alternatywnych możliwości. Możliwym tego przykładem jest Prognozowanie powtarzających się zamówień na subskrypcję online za pomocą Facebooka Prophet i R.
5) Sines i Cosine są nieprzejrzystym sposobem radzenia sobie z sezonowością, podczas gdy efekty sezonowe, takie jak dzień tygodnia, dzień miesiąca, tydzień miesiąca, miesiąc roku są o wiele bardziej skuteczny / informacyjny w przypadku efektów antropogenicznych (w kontaktach z ludźmi!).
Sugerowanie częstotliwości 365,25 dla rocznych wzorców nie ma sensu, ponieważ nie wykonujemy tej samej akcji dokładnie tego samego dnia, co w zeszłym roku, podczas gdy miesięczna aktywność jest znacznie bardziej trwała, ale wydaje się, że Prorok nie oferuje 11 miesięcznych wskaźników opcja. Tygodniowe częstotliwości 52 nie mają sensu, ponieważ nie mamy 52 tygodni każdego roku.
6) Nie próbuje się sprawdzać poprawności procesów błędów będących gaussowskimi, więc można przeprowadzić znaczące testy istotności.
7) Brak obawy, że wariancja błędu modelu będzie jednorodna, tj. Nie zmieni się deterministycznie w poszczególnych punktach czasu, co sugeruje najmniejsze ważone kwadraty. Nie ma obaw o znalezienie optymalnej transformacji mocy, która poradziłaby sobie z wariancją błędu proporcjonalną do oczekiwanej wartości Kiedy (i dlaczego) powinieneś wziąć log rozkładu (liczb)? .
8) Użytkownik musi wstępnie określić wszystkie możliwe efekty wyprzedzenia i opóźnienia w związku z wydarzeniami / świętami. Na przykład codzienna sprzedaż często zaczyna rosnąć pod koniec listopada, odzwierciedlając długoterminowy efekt świąt Bożego Narodzenia.
9) Nie ma obaw, że powstałe błędy są wolne od struktury, co sugeruje sposoby ulepszenia modelu poprzez diagnostyczne sprawdzenie wystarczalności.
10) Najwyraźniej nie ma obaw o ulepszenie modelu poprzez usunięcie nieistotnej struktury.
11) Nie ma możliwości uzyskania rodziny symulowanych prognoz, w których limity ufności niekoniecznie muszą być symetryczne poprzez ładowanie błędów modelu z uwzględnieniem ewentualnych anomalii.
12) Pozwalanie użytkownikowi na przyjmowanie założeń dotyczących trendów (liczba punktów przerwania trendu i rzeczywistych punktów przerwania) pozwala na niechcianą / nieużyteczną elastyczność w obliczu analizy na dużą skalę, która ze swojej nazwy jest przeznaczona do wielkoformatowych aplikacji głośnomówiących.