Mam historyczne dane o sprzedaży z piekarni (codziennie, ponad 3 lata). Teraz chcę zbudować model do przewidywania przyszłej sprzedaży (przy użyciu funkcji takich jak dzień tygodnia, zmienne pogodowe itp.).
Jak podzielić zestaw danych w celu dopasowania i oceny modeli?
- Czy musi to być chronologiczny podział pociągu / zatwierdzenia / testu?
- Czy zrobiłbym wtedy dostrajanie hiperparametrów z zestawem pociągu i sprawdzania poprawności?
- Czy (zagnieżdżona) walidacja krzyżowa jest złą strategią dla problemu szeregów czasowych?
EDYTUJ
Oto kilka linków, które napotkałem po przejściu na adres URL sugerowany przez @ ene100:
- Rob Hyndman opisujący „pochodzenie prognozowania kroczącego” w teorii i praktyce (z kodem R)
- innymi terminami na początek prognozowania kroczącego są „optymalizacja” ( tutaj lub tutaj ), „kroczący horyzont” lub „ruchomy początek”
- Wydaje się, że techniki te nie zostaną zintegrowane ze scikit-learning w najbliższej przyszłości, ponieważ „zapotrzebowanie na te techniki i ich priorytetowość jest niejasna” (podana tutaj ).
I to jest kolejna propozycja dla szeregów czasowych krzyżowej walidacji.