Mam zestaw danych szeregów czasowych. Każda seria obejmuje ten sam okres, chociaż rzeczywiste daty w każdej serii czasowej mogą nie być dokładnie w jednej linii.
To znaczy, jeśli szeregi czasowe miałyby zostać odczytane w matrycy 2D, wyglądałoby to tak:
date T1 T2 T3 .... TN
1/1/01 100 59 42 N/A
2/1/01 120 29 N/A 42.5
3/1/01 110 N/A 12 36.82
4/1/01 N/A 59 40 61.82
5/1/01 05 99 42 23.68
...
31/12/01 100 59 42 N/A
etc
Chcę napisać skrypt R, który podzieli szeregi czasowe {T1, T2, ... TN} na „rodziny”, w których rodzina jest zdefiniowana jako zbiór szeregów, które „mają tendencję do poruszania się ze sobą w sympatii”.
W części „grupowanie” będę musiał wybrać / zdefiniować rodzaj miary odległości. Nie jestem do końca pewien, jak sobie z tym poradzić, ponieważ mam do czynienia z szeregami czasowymi, a para szeregów, które mogą poruszać się ze współczuciem w jednym przedziale, może nie robić tego w kolejnym przedziale.
Jestem pewien, że jest tu znacznie więcej doświadczonych / sprytnych ludzi, więc byłbym wdzięczny za wszelkie sugestie, pomysły na temat tego, jakiego algorytmu / heurystyki użyć do pomiaru odległości i jak wykorzystać to w grupowaniu szeregów czasowych.
Domyślam się, że NIE ma ustalonej solidnej metody statystycznej, aby to zrobić, więc byłbym bardzo zainteresowany, aby zobaczyć, jak ludzie podchodzą / rozwiązują ten problem - myśląc jak statystyki.