Korelacja mierzy zależność liniową. W kontekście nieformalnym związek oznacza coś stabilnego. Kiedy obliczamy korelację próbki dla zmiennych stacjonarnych i zwiększamy liczbę dostępnych punktów danych, ta korelacja próbki dąży do prawdziwej korelacji.
Można wykazać, że w przypadku cen, które zwykle są spacerami losowymi, korelacja próbki dąży do zmiennej losowej. Oznacza to, że bez względu na to, ile danych mamy, wynik zawsze będzie inny.
Uwaga Próbowałem wyrazić intuicję matematyczną bez matematyki. Z matematycznego punktu widzenia wyjaśnienie jest bardzo jasne: przykładowe momenty procesów stacjonarnych zbiegają się w prawdopodobieństwie ze stałymi. Przykładowe momenty losowych spacerów są zbieżne z całkami ruchu Browna, które są zmiennymi losowymi. Ponieważ związek jest zwykle wyrażany jako liczba, a nie zmienna losowa, staje się oczywisty powód nie obliczania korelacji dla zmiennych niestacjonarnych.
Aktualizacja Ponieważ jesteśmy zainteresowani korelacją między dwiema zmiennymi, najpierw załóżmy, że pochodzą one z procesu stacjonarnego . Stacjonarność oznacza, że i nie zależą od . Więc korelacjaE Z t c o v ( Z t , Z t - h ) tZt=(Xt,Yt)EZtcov(Zt,Zt−h)t
corr(Xt,Yt)=cov(Xt,Yt)DXtDYt−−−−−−−√
również nie zależy od , ponieważ wszystkie wielkości we wzorze pochodzą z macierzy , która nie zależy od . Tak więc obliczenie korelacji próbkic o v ( Z t ) ttcov(Zt)t
ρ=CORR(X, T,Yt)ρ→ρT→∞√
ρ^=1T∑Tt=1(Xt−X¯)(Yt−Y¯)1T2∑Tt=1(Xt−X¯)2∑Tt=1(Yt−Y¯)2−−−−−−−−−−−−−−−−−−−−−−−−−−−√
ma sens, ponieważ możemy mieć uzasadnioną nadzieję, że korelacja próbki oszacuje . Okazuje się, że ta nadzieja nie jest bezpodstawna, ponieważ dla stacjonarnych procesów spełniających określone warunki, które mamy , jak prawdopodobieństwa. Ponadto w dystrybucji, dzięki czemu możemy przetestować hipotezy dotyczące .
ρ=corr(Xt,Yt)ρ^→ρT→∞ρT−−√(ρ^−ρ)→N(0,σ2ρ)ρ
Załóżmy teraz, że nie jest stacjonarny. Zatem może zależeć od . Więc kiedy obserwujemy próbkę wielkości , potencjalnie musimy oszacować różne korelacje . Jest to oczywiście niemożliwe, dlatego w najlepszym przypadku możemy oszacować tylko niektóre funkcje takie jak średnia lub wariancja. Ale wynik może nie mieć sensownej interpretacji. c o r r ( X t , Y t ) t T T ρ t ρ tZtcorr(Xt,Yt)tTTρtρt
Przyjrzyjmy się teraz, co dzieje się z korelacją prawdopodobnie najbardziej zbadanego losowego spaceru niestacjonarnego procesu. Proces chodzeniem losowym, jeśli , gdzie jest procesem stacjonarnym. Dla uproszczenia załóżmy, że . NastępnieZ t = ∑ t s = 1 ( U t , V t ) C t = ( U t , V t ) E C t = 0Zt=(Xt,Yt)Zt=∑ts=1(Ut,Vt)Ct=(Ut,Vt)ECt=0
corr(XtYt)=EXtYtDXtDYt−−−−−−−√=E∑ts=1Ut∑ts=1VtD∑ts=1UtD∑ts=1Vt−−−−−−−−−−−−−−−−√
Aby jeszcze bardziej uprościć sprawę, załóżmy, że jest białym szumem. Oznacza to, że wszystkie korelacje są zerowe dla . Zauważ, że nie ogranicza to do zera.E ( C t C t + h ) h > 0 c o r r ( U t , V t )Ct=(Ut,Vt)E(CtCt+h)h>0corr(Ut,Vt)
Następnie
corr(Xt,Yt)=tEUtVtt2DUtDVt−−−−−−−−√=corr(U0,V0).
Jak dotąd dobrze, choć proces nie jest stacjonarny, korelacja ma sens, chociaż musieliśmy przyjąć takie same restrykcyjne założenia.
Teraz, aby zobaczyć, co dzieje się z przykładową korelacją, będziemy musieli wykorzystać następujący fakt dotyczący losowych spacerów, zwany funkcjonalnym twierdzeniem o centralnym limicie:
y∈[0,1],W,S=(W1S,W2s)Ms=(M1s,M2s)=(
1T−−√Z[Ts]=1T−−√∑t=1[Ts]Ct→(cov(C0))−1/2Ws,
w rozkładzie, gdzie i jest dwuwymiarowy
Ruch Browna (dwuwymiarowy proces Wienera). Dla wygody definicję .
s∈[0,1]Ws=(W1s,W2s)Ms=(M1s,M2s)=(cov(C0))−1/2Ws
Ponownie dla uproszczenia zdefiniujmy próbkę korelacji jako
ρ^=1T∑Tt=1XtYt1T∑Tt=1X2t1T∑Tt=1Y2t−−−−−−−−−−−−−−−−−−√
Zacznijmy od wariancji. Mamy
E1T∑t=1TX2t=1TE∑t=1T(∑s=1tUt)2=1T∑t=1Ttσ2U=σUT+12.
Zwiększa się to do nieskończoności wraz ze wzrostem , więc trafiamy na pierwszy problem, wariancja próbki nie jest zbieżna. Z drugiej strony daje nam twierdzenie o ciągłym odwzorowaniu w połączeniu z funkcjonalnym twierdzeniem o granicy centralnejT
T→∞
1T2∑t=1TX2t=∑t=1T1T(1T−−√∑s=1tUt)2→∫10M21sds
gdzie zbieżność jest zbieżnością w dystrybucji, podobnie jak .
T→∞
Podobnie otrzymujemy
1
1T2∑t=1TY2t→∫10M22sds
i
1T2∑t=1TXtYt→∫10M1sM2sds
W końcu dla próbki korelacji naszego losowego marszu otrzymujemy
ρ^→∫10M1sM2sds∫10M21sds∫10M22sds−−−−−−−−−−−−−−−√
w dystrybucji jako .
T→∞
Zatem chociaż korelacja jest dobrze zdefiniowana, korelacja próbki nie jest do niej zbieżna, jak w przypadku procesu stacjonarnego. Zamiast tego zbiega się do pewnej zmiennej losowej.