Najlepsza metoda na krótkie serie czasowe

35

Mam pytanie związane z modelowaniem krótkich szeregów czasowych. Nie jest kwestią, czy je wymodelować , ale jak. Jaką metodę poleciłbyś do modelowania (bardzo) krótkich szeregów czasowych (powiedzmy o długości )? Przez „najlepszy” rozumiem tu najbardziej niezawodny, czyli najmniej podatny na błędy ze względu na ograniczoną liczbę obserwacji. W przypadku krótkich serii pojedyncze obserwacje mogą mieć wpływ na prognozę, dlatego metoda powinna zapewniać ostrożne oszacowanie błędów i możliwej zmienności związanej z prognozą. Zasadniczo jestem zainteresowany jednostronnymi szeregami czasowymi, ale ciekawym byłoby wiedzieć o innych metodach. $T \leq 20$

time-series forecasting small-sample

— Tim
źródło

Jaka jest jednostka czasu? Czy możesz opublikować dane?

— Dimitriy V. Masterov

8

Niezależnie od przyjętych założeń - dotyczących sezonowości, stacjonarności itp. - krótki szereg czasowy da ci szansę wykrycia tylko najbardziej rażących naruszeń; więc założenia powinny być uzasadnione w dziedzinie wiedzy. Potrzebujesz modelować, czy tylko robić prognozy? Konkurs M3 porównał różne „automatyczne” metody prognozowania serii z różnych domen, niektóre nawet tak krótkie, jak 20.

— Scortchi - Przywróć Monikę

5

+1 do komentarza @ Scortchi. Nawiasem mówiąc, spośród 3 003 serii M3 (dostępnych w Mcomppakiecie dla R) 504 ma 20 lub mniej obserwacji, a konkretnie 55% rocznych serii. Abyś mógł sprawdzić oryginalną publikację i zobaczyć, co sprawdzało się w przypadku danych rocznych. Lub nawet przejrzyj oryginalne prognozy przesłane do konkursu M3, które są dostępne w Mcomppakiecie (liście M3Forecast).

— S. Kolassa - Przywróć Monikę

Cześć, nie dodam niczego do odpowiedzi, ale po prostu podzielę się czymś na pytanie, które, mam nadzieję, może pomóc innym w zrozumieniu problemu tutaj: kiedy mówisz solidne, jest to najmniej podatne na błędy z powodu faktu ograniczonego liczba obserwacji . Wierzę, że solidność jest ważną koncepcją w statystykach i tutaj jest kluczowa, ponieważ mając tak mało danych, jakiekolwiek dopasowanie modelowania będzie silnie zależeć od założeń samego modelu lub wartości odstających. Dzięki solidności zmniejszasz te ograniczenia, nie dopuszczając do ograniczenia wyników. Mam nadzieję, że to pomoże.

— Tommaso Guerrini

2

@TommasoGuerrini niezawodne metody nie przyjmują mniejszych założeń, przyjmują różne założenia.

— Tim

31

To jest bardzo typowe dla bardzo prostych metod prognostycznych, takich jak „prognoza średnia historyczna” wyprzedzić bardziej skomplikowanych metod. Jest to jeszcze bardziej prawdopodobne w przypadku krótkich szeregów czasowych. Tak, w zasadzie możesz dopasować ARIMA lub nawet bardziej złożony model do 20 lub mniej obserwacji, ale raczej będziesz się przesadzał i otrzymywał bardzo złe prognozy.

Więc: zacznij od prostego testu porównawczego, np.

środek historyczny
historyczna mediana dodatkowej solidności
losowy spacer (prognoza ostatniej obserwacji)

Oceń je na danych poza próbą. Porównaj bardziej skomplikowany model z tymi wzorcami. Możesz być zaskoczony, widząc, jak trudno jest przewyższyć te proste metody. Ponadto porównaj solidność różnych metod z tymi prostymi, np. Nie tylko oceniając średnią dokładność poza próbą, ale także wariancję błędu , używając ulubionej miary błędu .

Tak, jak pisze Rob Hyndman w swoim poście, do którego prowadzi Aleksandr , testowanie poza próbą stanowi problem sam w sobie w krótkich seriach - ale tak naprawdę nie ma dobrej alternatywy. ( Nie używaj dopasowania w próbie, co nie jest wskazówką do dokładności prognozowania .) AIC nie pomoże ci z medianą i losowym marszem. Jednak mógł używać szeregów czasowych walidacji krzyżowej , która przybliża AIC, w każdym razie.

— S. Kolassa - Przywróć Monikę
źródło

Właśnie odkryłem twoją odpowiedź (+1). Zrobiłem kolejny komentarz, na wypadek gdybyście byli zainteresowani i chcieliby wyjaśnić.

— Aleksandr Blekh

17

Ponownie używam pytania jako okazji, aby dowiedzieć się więcej o szeregach czasowych - jednym z (wielu) tematów moich zainteresowań. Po krótkim badaniu wydaje mi się, że istnieje kilka podejść do problemu modelowania krótkich szeregów czasowych.

Pierwszym podejściem jest użycie standardowych / liniowych modeli szeregów czasowych (AR, MA, ARMA itp.), Ale zwrócenie uwagi na pewne parametry, jak opisano w tym poście [1] Roba Hyndmana, który nie potrzebuje wprowadzenia w szeregi czasowe i świat prognoz. Drugie podejście, do którego odwołuje się większość pokrewnej literatury, którą widziałem, sugeruje stosowanie nieliniowych modeli szeregów czasowych , w szczególności modeli progowych [2], które obejmują progowy model autoregresyjny (TAR) , samoistny TAR ( SETAR) , progowy autoregresyjny model średniej ruchomej (TARMA) i model TARMAX , który rozszerza TARmodel do egzogenicznych szeregów czasowych. Doskonałe przeglądy nieliniowych modeli szeregów czasowych, w tym modeli progowych, można znaleźć w tym dokumencie [3] i niniejszym [4].

Na koniec inny dokument badawczy związany z IMHO [5] opisuje interesujące podejście oparte na reprezentacji układów nieliniowych Volterra-Weinera - patrz to [6] i to [7]. Podejście to jest uważane za lepsze od innych technik w kontekście krótkich i hałaśliwych szeregów czasowych .

Referencje

Hyndman, R. (4 marca 2014). Dopasowanie modeli do krótkich szeregów czasowych. [Post na blogu]. Źródło: http://robjhyndman.com/hyndsight/short-time-series
Pennsylvania State University. (2015). Modele progowe. [Materiały szkoleniowe online]. STAT 510, Analiza zastosowanych szeregów czasowych. Źródło: https://onlinecourses.science.psu.edu/stat510/node/82
Zivot, E. (2006). Nieliniowe modele szeregów czasowych. [Notatki klasowe]. ECON 584, Ekonometria szeregów czasowych. Uniwersytet Waszyngtoński. Źródło: http://faculty.washington.edu/ezivot/econ584/notes/nonlinear.pdf
Chen, CWS, So, MKP i Liu, F.-C. (2011). Przegląd modeli szeregów czasowych progów w finansach. Statystyka i jej interfejs, 4 , 167–181. Źródło: http://intlpress.com/site/pub/files/_fulltext/journals/sii/2011/0004/0002/SII-2011-0004-0002-a012.pdf
Barahona, M. i Poon, C.-S. (1996). Wykrywanie nieliniowej dynamiki krótkich, hałaśliwych szeregów czasowych. Nature , 381,21-217. Źródło: http://www.bg.ic.ac.uk/research/m.barahona/nonlin_detec_nature.PDF
Franz, MO (2011). Seria Volterra i Wiener. Scholarpedia, 6 (10): 11307. Źródło: http://www.scholarpedia.org/article/Volterra_and_Wiener_series
Franz, MO, i Scholkopf, B. (nd). Jednolity pogląd na teorię Wienera i Volterry oraz wielomianową regresję jądra. Źródło: http://www.is.tuebingen.mpg.de/fileadmin/user_upload/files/publications/nc05_%5B0%5D.pdf

— Aleksandr Blekh
źródło

4

+1 Czy zechciałby pan napisać odniesienia do tych artykułów w swojej odpowiedzi? Niedawno dowiedzieliśmy się, że wiele linków do artykułów gnije po pewnym czasie, co ostatecznie czyni je prawie bezużytecznymi, chyba że autorzy, tytuły itp. Są również wymienione w tekście.

— whuber

2

@whuber: Dzięki. Żaden problem, dziś wieczorem zaktualizuję swoją odpowiedź o referencje.

— Aleksandr Blekh

2

+1 za link do postu Roba Hyndmana. (Kusi mnie jednak do -1 dla złożonych modeli. Byłbym bardzo ostrożny w stosowaniu progów lub innych nieliniowych metod szeregów czasowych w szeregach czasowych mniejszych niż 20 obserwacji. Jesteś prawie pewien, że się dopasujesz, co jest bezpośrednio przeciwne na wymaganie PO od solidnej metody.)

— S. Kolassa - Przywróć Monikę

3

[2,3,4] nie wspominają o krótkich szeregach czasowych i spójrz na wykresy w [2]:> 120 obserwacji. [4] koncentruje się na finansach, gdzie masz ponad 20 obserwacji. [5] pisze o „krótkich szeregach czasowych, zwykle o długości 1000 punktów” (s. 216). Nie widzę żadnego sposobu, aby rzetelnie i solidnie dopasować TAR lub podobny model, lub którykolwiek z bardziej złożonych, do którego linkujesz, z <20 obserwacjami. (BTW: Robię też pewne wnioskowania na boku, a przy mniej niż 20 obserwacjach naprawdę nie można oszacować więcej niż średniej i jeszcze jednego parametru.)

— S. Kolassa - Przywróć Monikę

5

Nie ma za co ;-) Chyba na wynos jest to, że „krótki” jest bardzo zależny od kontekstu: w przypadku serii odczytów czujników lub w finansach 1000 punktów danych jest „krótkich” - ale w zarządzaniu łańcuchem dostaw 20 miesięcznych obserwacji jest prawie normalne , a „krótki” rozpocznie się dopiero przy 12 lub mniejszej liczbie obserwacji.

— S. Kolassa - Przywróć Monikę

11

$T \leq 20$

Następujące metody jakościowe sprawdzają się w praktyce w przypadku bardzo krótkich danych lub ich braku:

Prognozy złożone
Ankiety
Metoda Delphi
Budowa scenariusza
Prognozowane przez analogię
Opinia wykonawcza

Jedną z najlepszych metod, o których wiem, że działa bardzo dobrze, jest zastosowanie ustrukturyzowanych analogii (5. na powyższej liście), w której szukasz podobnych / analogicznych produktów w kategorii, którą próbujesz przewidzieć, i używasz ich do prognozowania prognozowania krótkoterminowego . Zobacz w tym artykule przykłady i dokument SAS na temat tego, jak to zrobić, używając oczywiście SAS. Jednym ograniczeniem jest to, że prognozowanie przez analogie będzie działać tylko wtedy, gdy masz dobre analogie, w przeciwnym razie możesz polegać na prognozowaniu osądowym. Oto kolejny film z oprogramowania Forecastpro na temat korzystania z narzędzia takiego jak Forecastpro do prognozowania przez analogię. Wybór analogii jest bardziej sztuką niż nauką i potrzebujesz specjalistycznej wiedzy w dziedzinie, aby wybrać analogiczne produkty / sytuacje.

Dwa doskonałe zasoby do prognozowania krótkich lub nowych produktów:

Zasada prognozowania przez Armstronga
Prognozowanie nowego produktu przez Kahna

Poniższe informacje mają charakter poglądowy. Właśnie skończyłem czytać Sygnał i hałasautor: Nate Silver, ponieważ istnieje dobry przykład bańki i prognoz rynku mieszkaniowego w USA i Japonii (analogicznie do rynku amerykańskiego). Na poniższym wykresie, jeśli zatrzymasz się na 10 punktach danych i użyjesz jednej z metod ekstrapolacji (wygładzanie wykładnicze / ets / arima ...) i zobaczysz, dokąd cię zaprowadzi i gdzie faktycznie się skończyło. Ponownie przedstawiony przeze mnie przykład jest znacznie bardziej złożony niż prosta ekstrapolacja trendów. Ma to na celu podkreślenie ryzyka ekstrapolacji trendów przy użyciu ograniczonych punktów danych. Ponadto, jeśli Twój produkt ma wzór sezonowy, musisz użyć jakiejś formy analogicznej sytuacji produktu, aby prognozować. Przeczytałem artykuł, który według mnie w badaniu Journal of Business, że jeśli masz 13 tygodni sprzedaży produktów farmaceutycznych, możesz przewidzieć dane z większą dokładnością, używając analogicznych produktów.

wprowadź opis zdjęcia tutaj

— wróżka
źródło

Dziękujemy za wskazanie innego podejścia! I zgadzam się, książka Nate'a Silversa jest świetna.

— Tim

5

Założenie, że liczba obserwacji jest krytyczna, pochodzi z nieistotnego komentarza GEP Box dotyczącego minimalnej wielkości próby w celu identyfikacji modelu. Jeśli chodzi o mnie, bardziej szczegółową odpowiedzią jest to, że problem / jakość identyfikacji modelu nie opiera się wyłącznie na wielkości próbki, ale na stosunku sygnału do szumu w danych. Jeśli masz silny stosunek sygnału do szumu, potrzebujesz mniej obserwacji. Jeśli masz niskie s / n, potrzebujesz więcej próbek do identyfikacji. Jeśli Twój zestaw danych jest miesięczny, a masz 20 wartości, empirycznie nie możesz zidentyfikować modelu sezonowego, JEŚLI uważasz, że dane mogą być sezonowe, możesz rozpocząć proces modelowania, określając ar (12), a następnie wykonać diagnostykę modelu ( testy istotności) w celu zmniejszenia lub rozszerzenia modelu z niedoborem strukturalnym

— IrishStat
źródło

5

Mając bardzo ograniczone dane, byłbym bardziej skłonny do dopasowania danych przy użyciu technik bayesowskich.

Stacjonarność może być nieco trudna, gdy mamy do czynienia z Bayesowskimi modelami szeregów czasowych. Jednym z nich jest wymuszenie ograniczeń parametrów. Lub nie mogłeś. Jest to w porządku, jeśli chcesz tylko spojrzeć na rozkład parametrów. Jeśli jednak chcesz wygenerować predykcję późniejszą, możesz mieć wiele prognoz, które wybuchną.

Dokumentacja Stan podaje kilka przykładów, w których nakładają ograniczenia na parametry modeli szeregów czasowych w celu zapewnienia stacjonarności. Jest to możliwe w przypadku stosunkowo prostych modeli, których używają, ale może być prawie niemożliwe w bardziej skomplikowanych modelach szeregów czasowych. Jeśli naprawdę chcesz wymusić stacjonarność, możesz użyć algorytmu Metropolis-Hastings i wyrzucić wszelkie niewłaściwe współczynniki. Wymaga to jednak obliczenia wielu wartości własnych, co spowolni sytuację.

— Jan
źródło

0

Problem, jak mądrze wskazałeś, polega na „przeuczeniu” spowodowanym ustalonymi procedurami opartymi na listach. Sprytnym sposobem jest utrzymanie prostego równania w przypadku niewielkiej ilości danych. Przekonałem się po wielu księżycach, że jeśli po prostu użyjesz modelu AR (1) i pozostawisz szybkość adaptacji (współczynnik ar) do danych, wszystko może działać całkiem dobrze. Na przykład, jeśli oszacowany współczynnik ar jest bliski zeru, oznacza to, że ogólna średnia byłaby odpowiednia. jeśli współczynnik jest bliski +1.0, oznacza to, że ostatnia wartość (skorygowana o stałą jest bardziej odpowiednia. Jeśli współczynnik jest bliski -1.0, to najlepsza prognoza byłaby ujemna od ostatniej wartości (skorygowanej o stałą). Jeżeli współczynnik jest inny, oznacza to, że odpowiednia jest średnia ważona niedawnej przeszłości.

Właśnie od tego zaczyna się AUTOBOX, a następnie odrzuca anomalie, ponieważ precyzyjnie dostosowuje oszacowany parametr w przypadku napotkania „małej liczby obserwacji”.

Jest to przykład „sztuki prognozowania”, kiedy podejście oparte wyłącznie na danych może nie mieć zastosowania.

Poniżej znajduje się automatyczny model opracowany dla 12 punktów danych bez obaw o anomalie. z aktualną / dopasowaną i prognozą tutaj oraz resztkową działką tutaj

— IrishStat
źródło