Używam biblioteki VAR Pytsmodels do modelowania danych finansowych szeregów czasowych, a niektóre wyniki mnie zastanawiają. Wiem, że modele VAR zakładają, że dane szeregów czasowych są nieruchome. Nieumyślnie dopasowałem niestacjonarną serię cen logów dla dwóch różnych papierów wartościowych i, co zaskakujące, dopasowane wartości i prognozy w próbie były bardzo dokładne z relatywnie niewielkimi, stacjonarnymi resztkami. The na podstawie prognozy w próbie wyniósł 99%, a odchylenie standardowe prognozowanych serii rezydualnych wyniosło około 10% wartości prognozowanych.
Jednak, kiedy różnicuję ceny dziennika i dopasowuję te szeregi czasowe do modelu VAR, wartości dopasowania i prognozy są daleko od kreski, odbijając się w wąskim przedziale wokół średniej. W rezultacie reszty wykonują lepszą pracę prognozując zwroty dziennika niż wartości dopasowane, przy odchyleniu standardowym prognozowanych reszt 15X większych niż dopasowane serie danych a .007 wartość dla serii prognoz.
Czy źle interpretuję dopasowanie w stosunku do resztek w modelu VAR, czy popełniam jakiś inny błąd? Dlaczego niestacjonarne szeregi czasowe miałyby dawać dokładniejsze przewidywania niż stacjonarne oparte na tych samych podstawowych danych? Sporo pracowałem z modelami ARMA z tej samej biblioteki Pythona i nie widziałem nic takiego jak modelowanie danych pojedynczej serii.