Mam zmienną ciągłą, próbkowaną przez okres roku w nieregularnych odstępach czasu. Niektóre dni mają więcej niż jedną obserwację na godzinę, podczas gdy inne okresy nie mają nic przez kilka dni. To sprawia, że szczególnie trudno jest wykryć wzorce w szeregach czasowych, ponieważ niektóre miesiące (na przykład październik) są bardzo próbkowane, podczas gdy inne nie.
Moje pytanie brzmi: jakie byłoby najlepsze podejście do modelowania tej serii czasowej?
- Uważam, że większość technik analizy szeregów czasowych (takich jak ARiMR) wymaga stałej częstotliwości. Mogłem agregować dane, aby uzyskać stałą próbkę lub wybrać bardzo szczegółowy podzestaw danych. W przypadku obu opcji brakuje mi niektórych informacji z oryginalnego zestawu danych, które mogłyby ujawnić różne wzorce.
- Zamiast rozkładać serie w cyklach, mogłem zasilić model całym zestawem danych i oczekiwać, że wziął wzorce. Na przykład przekształciłem godzinę, dzień tygodnia i miesiąc w zmienne jakościowe i wypróbowałem regresję wielokrotną z dobrymi wynikami (R2 = 0,71)
Mam pomysł, że techniki uczenia maszynowego, takie jak ANN, mogą również wybierać te wzorce z nierównomiernych szeregów czasowych, ale zastanawiałem się, czy ktoś tego próbował i może dostarczyć mi porady na temat najlepszego sposobu reprezentowania wzorców czasowych w sieci neuronowej.