Rozważ następujący wykres:
Czerwona linia (lewa oś) opisuje wolumen obrotu pewnymi akcjami. Niebieska linia (prawa oś) opisuje głośność wiadomości na Twitterze dla tego towaru. Na przykład 9 maja (05-09) dokonano około 1.100 milionów transakcji i 4.000 tweetów.
Chciałbym obliczyć, czy istnieje korelacja między przedziałami czasowymi, tego samego dnia lub z opóźnieniem - na przykład: wolumen tweet koreluje z wolumenem obrotu dzień później. Czytam wiele artykułów, które dokonały takiej analizy, na przykład Korelowanie finansowych szeregów czasowych z działalnością mikroblogowania , ale nie opisują one, jak taka analiza jest przeprowadzana w praktyce. W artykule podano, co następuje:
Mam jednak bardzo małe doświadczenie w analizie statystycznej i nie wiem, jak to zrobić w serii, którą posiadam. Używam SPSS (znanego również jako PASW), a moje pytanie brzmi: jakie kroki należy podjąć, aby dokonać takiej analizy od momentu, w którym plik danych leży u podstaw powyższego obrazu? Czy taki test jest funkcją domyślną (i jak się nazywa) i / lub w jaki sposób mógłbym go wykonać?
Każda pomoc byłaby bardzo mile widziana :-)