Kolejne pytanie o szeregi czasowe ode mnie.
Mam zestaw danych, który codziennie rejestruje przypadki przemocy w szpitalu psychiatrycznym w ciągu trzech lat. Z pomocą mojego poprzedniego pytania bawiłem się nim i jestem teraz trochę szczęśliwy.
Mam teraz to, że codzienna seria jest bardzo głośna. Zmienia się gwałtownie, w górę i w dół, od 0 do 20 razy. Używając mniejszych wykresów i pakietu prognozy (co mogę bardzo polecić początkującym takim jak ja), po prostu otrzymuję całkowicie płaską linię, z ogromnymi przedziałami ufności z prognozy.
Jednak agregowanie danych tygodniowych lub miesięcznych ma znacznie większy sens. Zamiatają od początku serii, a następnie ponownie rosną w środku. Zarówno fabuła, jak i pakiet prognostyczny dają coś, co wygląda na znacznie bardziej znaczące.
To trochę przypomina oszustwo. Czy po prostu wolę wersje zagregowane, ponieważ wyglądają ładnie, bez prawdziwej ważności?
A może lepiej obliczyć średnią ruchomą i wykorzystać ją jako podstawę? Obawiam się, że nie rozumiem teorii stojącej za tym wszystkim wystarczająco dobrze, aby mieć pewność co do tego, co jest dopuszczalne