Moje sugerowane podejście obejmuje modele, które są znacznie bardziej ogólne niż ARIMA, ponieważ obejmują potencjał sezonowych manekinów, które mogą się zmieniać w czasie, wiele poziomów, wiele trendów, parametry, które mogą się zmieniać w czasie, a nawet wariancje błędów, które mogą się zmieniać w czasie. Ta rodzina jest bardziej precyzyjnie nazywana modelami ARMAX, ale dla pełnej przejrzystości wyklucza (rzadki) wariant, który ma strukturę multiplikatywną.
Poprosiłeś o wskazówki i uważam, że może to być dobry początek.
Sugerowałbym napisanie kodu, aby śledzić / emulować ten schemat blokowy / przepływ pracy. „Najlepszy model” można znaleźć, oceniając określone przez ciebie kryterium ... może to być MSE / AIC dopasowanych danych lub może to być MAPE / SMAPE ukrytych danych lub dowolne wybrane kryterium.
Pamiętaj, że wyszczególnienie każdego z tych kroków może być dość proste, jeśli nie znasz niektórych szczegółowych wymagań / celów / ograniczeń analizy szeregów czasowych, ALE może być (powinno być!) Bardziej złożone, jeśli masz głębsze zrozumienie / poznanie / zrozumienie zawiłości / możliwości obecnych w dokładnej analizie szeregów czasowych.
Poproszono mnie o podanie dalszych wskazówek, jak należy zautomatyzować modelowanie szeregów czasowych (lub ogólnie modelowanie) /stats//search?q=peeling+an+onion zawiera niektóre z moich wskazówek na temat „obieranie cebuli” i powiązane zadania.
AUTOBOX tak naprawdę opisuje szczegóły i pokazuje kroki pośrednie, ponieważ tworzy użyteczny model i może być przydatnym nauczycielem w tym zakresie. Cały pomysł naukowy polega na „dodaniu tego, co wydaje się potrzebne” i „usunięciu tego, co wydaje się mniej niż przydatne”. Jest to proces iteracyjny sugerowany wcześniej przez Boxa i Bacona.
Modele muszą być wystarczająco złożone (wystarczająco fantazyjne), ale niezbyt złożone (fantazyjne). Zakładanie, że proste metody działają ze złożonymi problemami, nie jest zgodne z metodą naukową podążającą za Rogerem Baconem i mnóstwem zwolenników Bacona. Jak powiedział kiedyś Roger Bacon i często parafrazowałem: „Robienie nauki to poszukiwanie powtarzających się wzorów. Aby wykryć anomalie, należy zidentyfikować wartości, które nie są zgodne z powtarzającymi się wzorami. Każdy bowiem, kto zna drogi Natury, z łatwością zauważy jej odchylenia, a z drugiej strony, kto zna jej odchylenia, dokładniej opisa swoje odchylenia. Uczy się reguł, obserwując, kiedy zawodzą obecne reguły. W spironie Bacon, identyfikując, kiedy aktualnie zidentyfikowany „najlepszy model / teoria” jest nieodpowiedni, można następnie przejść do „lepszej reprezentacji”
Według moich słów „Tukey zaproponował Exploratory Data Analysis (EDA), która sugerowała schematy udoskonalenia modelu w oparciu o oczywisty niedobór modelu sugerowany przez dane”. To serce AUTOBOX i nauki. EDA ma na celu sprawdzenie, co dane mogą nam powiedzieć poza formalnym zadaniem modelowania lub testowania hipotez.
Test lakmusowy programu do automatycznego modelowania jest dość prosty. Czy oddziela sygnał i szum bez nadmiernego dopasowania? Dowody empiryczne sugerują, że można to zrobić. Dokładności prognozowania są często mylące, ponieważ przyszłość nie ponosi odpowiedzialności za przeszłość i zależnie od tego, które pochodzenie wybierzesz, wyniki mogą się różnić.