Pracuję nad opracowaniem modelu do przewidywania całkowitej sprzedaży produktu. Mam około półtora roku rezerwacji, więc mógłbym przeprowadzić standardową analizę szeregów czasowych. Mam jednak również wiele danych na temat każdej „możliwości” (potencjalnej sprzedaży), która została zamknięta lub utracona. „Możliwości” są realizowane etapami rurociągu, dopóki nie zostaną zamknięte lub utracone; powiązali również dane dotyczące potencjalnego nabywcy, sprzedawcy, historii interakcji, branży, szacowanej wielkości rezerwacji itp.
Moim celem jest ostatecznie przewidzieć całkowitą liczbę rezerwacji, ale chcę uwzględnić wszystkie te informacje o obecnych „możliwościach”, które są prawdziwą „pierwotną przyczyną” rezerwacji.
Jednym z moich pomysłów jest użycie dwóch różnych modeli szeregowo w następujący sposób:
Użyj historycznych „szans”, aby zbudować model, który przewiduje rezerwacje wynikające z indywidualnej „szansy” (prawdopodobnie użyłbym losowych lasów lub nawet zwykłej starej regresji liniowej na tym etapie).
Skorzystaj z modelu od 1, aby przewidzieć szacowane rezerwacje wszystkich „szans” obecnie w przygotowaniu, a następnie zsumuj te szacunki na podstawie miesiąca, w którym każda „szansa” została utworzona.
Użyj modelu szeregów czasowych (być może ARIMA?), Korzystając z 1,5-miesięcznych historycznych danych szeregów czasowych ORAZ przewidywanych (przy użyciu modelu z 1) całkowitych rezerwacji wszystkich „możliwości” utworzonych w tym miesiącu.
To prawda, że opóźnienie w tych możliwościach przekształci się w faktyczne rezerwacje, ale model szeregów czasowych powinien być w stanie poradzić sobie z opóźnieniem.
Jak to brzmi? Dużo czytałem na temat szeregów czasowych i przewidywania sprzedaży, a z tego, co mogę powiedzieć, jest to dość wyjątkowe podejście. Dlatego naprawdę doceniam wszelkie opinie!