Mam model prognozowania dla szeregów czasowych i chcę obliczyć jego błąd prognozowania poza próbą. W tej chwili strategię, którą stosuję, jest ta sugerowana na blogu Roba Hyndmana (w dolnej części strony), która wygląda następująco (zakładając szereg czasowy i zestaw treningowy o rozmiarze k )
- Dopasować model do danych i niech y t + k jest prognoza dla następnego obserwacji.
- Obliczenia prognozowanych błąd jako .
- Powtórz dla
- Oblicz średni błąd kwadratowy jako
Moje pytanie brzmi: jak bardzo muszę się martwić o korelacje z powodu moich nakładających się zestawów treningowych. W szczególności, że chcę prognozować nie tylko kolejną wartość, ale następny wartości, tak że mam przewidywania y t + k , ... , y t + k + m - 1 i błędy e t , 1 , ... , e t , m i chcę zbudować strukturę terminów błędów prognozowania.
Czy mogę za każdym razem obrócić okno zestawu treningowego o 1, czy też powinienem obrócić go do przodu o ? Jak zmieniają się odpowiedzi na te pytania, jeśli w przewidywanej przeze mnie serii występuje znaczna autokorelacja (możliwe, że jest to proces o długiej pamięci, tj. Funkcja autokorelacji rozpada się raczej jako prawo mocy niż wykładniczo).
Byłbym wdzięczny za wyjaśnienie tutaj lub linki do miejsca, w którym mogę znaleźć teoretyczne wyniki dotyczące przedziałów ufności wokół MSE (lub innych miar błędów).