Mam wielowymiarowy zestaw danych szeregów czasowych, w tym oddziałujące zmienne biologiczne i środowiskowe (oraz ewentualnie niektóre zmienne egzogeniczne). Oprócz sezonowości w danych nie ma wyraźnego trendu długoterminowego. Moim celem jest sprawdzenie, które zmienne są ze sobą powiązane. Tak naprawdę nie szuka się prognozowania.
Będąc nowym w analizie szeregów czasowych, przeczytałem kilka referencji. O ile rozumiem, odpowiedni byłby wektorowy model autoregresji (VAR), ale nie czuję się dobrze z sezonowością i większość przykładów dotyczyła dziedziny ekonomii (tak często z analizą szeregów czasowych…) bez sezonowości.
Co powinienem zrobić z moimi danymi sezonowymi? Rozważyłem ich odsezonowanie - na przykład w R użyłbym, decompose
a następnie użyłem $trend + $rand
wartości, aby uzyskać sygnał, który wydaje się dość stacjonarny (zgodnie z oceną acf
). Wyniki modelu VAR są dla mnie mylące (wybierany jest model 1-lagowy, podczas gdy intuicyjnie oczekiwałbym więcej, i tylko współczynniki dla autoregresji - a nie dla regresji z innymi zmiennymi opóźnionymi - są znaczące). Czy robię coś źle, czy powinienem wyciągnąć wniosek, że moje zmienne nie są (liniowo) powiązane / mój model nie jest dobry (pytanie pomocnicze: czy istnieje nieliniowy odpowiednik VAR?).
[Alternatywnie, przeczytałem, że prawdopodobnie mógłbym użyć fałszywych zmiennych sezonowych, chociaż nie mogę dokładnie dowiedzieć się, jak to zaimplementować].
Sugestie krok po kroku byłyby bardzo mile widziane, ponieważ szczegóły dla doświadczonych użytkowników mogą faktycznie być dla mnie pouczające (a fragmenty kodu R lub linki do konkretnych przykładów są oczywiście bardzo mile widziane).