Załóżmy, że mam trochę ponad 20 000 miesięcznych szeregów czasowych od stycznia do 05 grudnia. Każdy z nich reprezentuje globalne dane dotyczące sprzedaży innego produktu. Co jeśli zamiast obliczać prognozy dla każdego z nich, chciałbym skoncentrować się tylko na niewielkiej liczbie produktów, które „faktycznie mają znaczenie”?
Mógłbym uszeregować te produkty według całkowitych rocznych przychodów i skrócić listę za pomocą klasycznego Pareto. Mimo to wydaje mi się, że chociaż nie mają większego wpływu na wyniki finansowe, niektóre produkty są tak łatwe do przewidzenia, że ich pominięcie byłoby złym osądem. Produkt, który w ciągu ostatnich 10 lat sprzedawał 50 $ każdego miesiąca, może nie brzmieć zbyt wiele, ale generowanie prognoz dotyczących przyszłej sprzedaży wymaga tak niewielkiego wysiłku, że równie dobrze mogę to zrobić.
Powiedzmy, że dzielę moje produkty na cztery kategorie: wysokie przychody / łatwe do prognozowania - niskie przychody / łatwe do prognozowania - wysokie przychody / trudne do prognozowania - niskie przychody / trudne do prognozowania.
Myślę, że rozsądne byłoby pozostawienie tylko tych szeregów czasowych należących do czwartej grupy. Ale jak dokładnie mogę ocenić „przewidywalność”?
Współczynnik zmienności wydaje się dobrym punktem wyjścia (pamiętam też jakiś artykuł na ten temat jakiś czas temu). Ale co jeśli moje serie czasowe wykazują sezonowość / przesunięcia poziomów / efekty kalendarza / silne trendy?
Wyobrażam sobie, że moją ocenę powinien opierać wyłącznie na zmienności elementu losowego, a nie na podstawie „surowych” danych. A może coś mi brakuje?
Czy ktoś wcześniej napotkał podobny problem? Jak byście to zrobili?
Jak zawsze każda pomoc jest mile widziana!