Prawdopodobnie najprostszym podejściem jest, jak sugerował Andy W, zastosowanie modelu sezonowych jednowymiarowych szeregów czasowych. Jeśli używasz R, albo spróbować auto.arima()
albo ets()
z pakietem prognozy .
Albo powinno działać dobrze, ale ogólna metoda szeregów czasowych nie wykorzystuje wszystkich dostarczonych informacji. W szczególności wydaje się, że znasz kształt krzywej każdego roku, więc lepiej byłoby wykorzystać te informacje, odpowiednio modelując dane każdego roku. Poniżej znajduje się sugestia, która próbuje uwzględnić te informacje.
Wygląda na to, że jakaś krzywa sigmoidalna załatwi sprawę. np. przesunięta logistyka:
dla roku tygodnia gdzie , i są parametrami do oszacowania. jest asymptotycznym maksimum, kontroluje tempo wzrostu, a jest punktem środkowym, gdy . (Potrzebny będzie inny parametr, aby umożliwić opisaną asymetrię, dzięki czemu tempo wzrostu do czasu jest szybsze niż po
fat ,j=rtmizat( j -bt)1 +mizat( j -bt)
tjotzatbtrtrtzatbtfat , j=rt/ 2btbt. Najprostszym sposobem na to jest zezwolenie na przyjmowanie różnych wartości przed i po czasie .)
zatbt
Parametry można oszacować za pomocą najmniejszych kwadratów dla każdego roku. Parametry tworzą szereg czasowy: , i . Można je prognozować przy użyciu standardowych metod szeregów czasowych, chociaż przy prawdopodobnie nie można wiele zrobić poza wykorzystaniem średniej z każdej serii do tworzenia prognoz. Następnie dla roku 6 oszacowanie wartości w tygodniu jest po prostu gdzie wykorzystywane są prognozy , i .za1, … ,zanb1, … ,bnr1, … ,rnn = 5jotfa^( 6 , j )za6b6r6
Gdy zaczną być obserwowane dane dla roku 6, będziesz chciał zaktualizować to oszacowanie. Po uzyskaniu każdej nowej obserwacji oszacuj krzywą sigmoidalną na dane z roku 6 (na początek potrzebne będą co najmniej trzy obserwacje, ponieważ istnieją trzy parametry). Następnie ważona średnia prognozy uzyskane przy użyciu danych do roku 5 i prognozy uzyskane przy użyciu tylko dane od 6 roku, przy czym masy są równe i odpowiednio . Jest to bardzo ad hoc i jestem pewien, że można to uczynić bardziej obiektywnym poprzez umieszczenie go w kontekście większego modelu stochastycznego. Niemniej jednak prawdopodobnie będzie działać dobrze dla twoich celów.( 40 - t ) / 36( t - 4 ) / 36