Obecnie pracuję nad projektem dotyczącym prognozowania danych szeregów czasowych (dane miesięczne). Używam R. do prognozowania. Mam 1 zmienną zależną (y) i 3 zmienne niezależne (x1, x2, x3). Zmienna y ma 73 obserwacje, podobnie jak pozostałe 3 zmienne (alos 73). Od stycznia 2009 r. Do stycznia 2015 r. Sprawdziłem korelacje i wartość p, a to wszystko znaczące, aby umieścić ją w modelu. Moje pytanie brzmi: jak mogę dokonać dobrej prognozy przy użyciu wszystkich zmiennych niezależnych? Nie mam przyszłych wartości dla tych zmiennych. Powiedzmy, że chciałbym przewidzieć, jaka będzie moja zmienna y w ciągu 2 lat (w 2017 r.). W jaki sposób mogę to zrobić?
Próbowałem następującego kodu:
model = arima(y, order(0,2,0), xreg = externaldata)
Czy mogę wykonać prognozę wartości y na 2 lata za pomocą tego kodu?
Próbowałem także kod regresji:
reg = lm(y ~ x1 + x2 + x3)
Ale jak mogę poświęcić czas na ten kod? Jak mogę przewidzieć, jaka będzie moja wartość y, powiedzmy 2 lata? Jestem nowy w statystyce i prognozowaniu. Zrobiłem trochę odczytu i kamery dla wartości opóźnienia, ale jak mogę użyć wartości opóźnienia w modelu do prognozowania?
Właściwie moje ogólne pytanie brzmi: jak mogę prognozować dane szeregów czasowych ze zmiennymi zewnętrznymi bez przyszłej wartości?