Jak sprawdzić, czy macierz krzyżowej kowariancji jest niezerowa?


11

Tło moich badań :

W próbkowaniu Gibbsa, w którym próbkujemy (zmienną interesów) i z i , gdzie i są losowymi wektorami wymiarowymi. Wiemy, że proces zwykle dzieli się na dwa etapy:Y P ( X | Y ) P ( Y | X ) X Y kXYP(X|Y)P(Y|X)XYk

  1. Okres wygrzewania, w którym usuwamy wszystkie próbki. Oznacz próbki jako i .Y 1Y tX1XtY1Yt
  2. Okres „po wypaleniu”, w którym uśredniamy próbki jako nasz końcowy pożądany wynik.X¯=1ki=1kXt+i

Jednak próbki w sekwencji „dopalania” nie są niezależnie dystrybuowane. Dlatego jeśli chcę sprawdzić wariancję wyniku końcowego, staje sięXt+1Xt+k

Var[X¯]=Var[i=1kXt+i]=1k2(i=1kVar[Xt+i]+i=1k1j=i+1kCov[Xt+i,Xt+j])

Tutaj termin nazwa to macierzy krzyżowej kowariancji dotyczy dowolnej z .k × k ( i , j ) i < jCov[Xt+i,Xt+j]k×k(i,j)i<j

Na przykład mam

Xt+1=(1,2,1)Xt+2=(1,0,2)Xt+3=(1,0,0)Xt+4=(5,0,1)

wtedy mógłbym oszacować macierz kowariancji pomocąCov[Xt+i,Xt+i+1]

13i=13(Xt+iμt+i)(Xt+i+1μt+i+1)

Teraz jestem zainteresowany, czy wynikowa estymacja jest znacząco niezerowa, dlatego muszę ją uwzględnić w mojej estymacji wariancji nazwa .Var[X¯]

Oto moje pytania :

  1. My próbki od . Ponieważ się zmienia, myślę, że i nie są z tej samej dystrybucji, więc to nie to samo, co nazwa . Czy to stwierdzenie jest prawidłowe? P ( X t + i | Y t + i ) Y t + i X t + i X t + i + 1 Cov [ X t + i , X t + j ] Cov [ X t + i , X t + i ]Xt+iP(Xt+i|Yt+i)Yt+iXt+iXt+i+1Cov[Xt+i,Xt+j]Cov[Xt+i,Xt+i]
  2. Załóżmy, że mam wystarczającą ilość danych, aby oszacować (sąsiednie próbki w sekwencji), czy istnieje sposób na sprawdzenie, czy macierz kowariancji jest niezerowa matryca? Mówiąc ogólnie, interesuje mnie wskaźnik, który prowadzi mnie do pewnych znaczących macierzy krzyżowania kowariancji, które powinny być uwzględnione w mojej ostatecznej ocenie wariancji.Cov[Xt+i,Xt+i+1]

4
W rzeczywistości wygląda to na całkiem dobre pytanie; Myślę, że niektórzy ludzie będą lepiej przygotowani do udzielania dobrych odpowiedzi ode mnie, więc chciałbym to promować (wystawić nagrodę), gdy wkrótce stanie się kwalifikowalny. [Krótkie odpowiedzi: 1. Te dwie kowariancje są różne. 2. Nie musisz sprawdzać, czy kolejne zmienne są skorelowane (we wszystkich, z wyjątkiem najbardziej trywialnych przypadków; algorytm działa poprzez generowanie zmiennych zależnych) - bardziej interesujące jest zmierzenie korelacji niż jej przetestowanie;] ... jeśli dobre odpowiedzi nie pojawiają się.
Zamienię

4
Wygląda na to, że twoje pytanie jest znacznie szersze niż pytanie tytułowe. Konkretnie odnosząc się do twojego pytania tytułowego, istnieje test sferyczności Bartletta, który pozwala sprawdzić, czy przykładowa macierz kowariancji jest ukośna. Prawdopodobnie trzeba by go dostosować do scenariusza krzyżowej kowariancji (twoja „macierz kowariancji” tak naprawdę nie jest tak naprawdę macierzą kowariancji, to macierz krzyżowej kowariancji; to nie przekątny blok pełnej macierzy kowariancji X_t i X_ { t + 1} razem). CC do @Glen_b.
ameba

2
Dodałbym, że kowariancje mają tendencję do zanikania mniej więcej geometrycznego (coraz bardziej wraz z oddalaniem się); wartości daleko od siebie odległe w czasie mają zwykle bardzo niską korelację ( nie zero, ale w dużej mierze ignorowalne), podczas gdy te blisko siebie mogą czasem być całkiem zależne.
Glen_b

1
@Tom 1. Co się jednak dzieje z ACF przy seriach stacjonarnych przy bardzo odległych opóźnieniach (4 nie jest daleko!) 2. Wiesz coś o tym, jak działają generowane wartości z MCMC, czego nie można powiedzieć o dowolnych szeregach czasowych ... są one Markowskie . Zauważysz, że moje wcześniejsze komentarze nie twierdzą, że najbliższe opóźnienia muszą wykazywać rozpad geometryczny (np. Nie powiedziałem, że nie można zobaczyć wyższej korelacji przy opóźnieniu 4 niż 3). Nadal będziesz miał (jeśli pewne warunki się utrzymują) tendencję do rozpadu geometrycznego w ACF podczas oddalania się od siebie.
Glen_b

2
Jeśli twój okres próbkowania jest tak krótki, że nie masz bardzo dokładnych oszacowań kowariancji krzyżowej, być może będziesz musiał poradzić sobie z faktem, że twoje szacunki warunków krzyżowych kowariancji mają duży błąd standardowy. Biorąc pod uwagę moje obecne rozumienie, jeszcze silniej potwierdzę swój sprzeciw wobec testowania korelacji. Testowanie hipotez dla korelacji zerowych z niezerowymi nie rozwiązuje tutaj twojego problemu.
Glen_b

Odpowiedzi:


1
  1. Próbkujemy z P ( X t + i | Y t + i ) . Ponieważ Y t + i się zmienia, myślę X t + í i X t + i + 1 nie są z tego samego rozkładu [...]Xt+iP(Xt+i|Yt+i)Yt+iXt+iXt+i+1

Mylisz tutaj dystrybucje warunkowe i bezwarunkowe, patrz także moja następna uwaga. Warunkowo na i , . Ale cały punkt konstruowania próbnik Gibbsa jest próbka z nieruchomymi rozkładów i . Z grubsza mówiąc, jeśli prowadzisz swój łańcuch wystarczająco długo, aby za rozkładem stacjonarnym, możesz powiedzieć co oznacza, że ​​bezwarunkowy rozkładYt+i=y1 P ( X t + i | Y t + i = y 1 ) P ( X t + i + 1 | Y t + i + 1 = y 2 ) X Y { Y t } P ( X t ) = Y P ( XYt+i+1=y2P(Xt+i|Yt+i=y1)P(Xt+i+1|Yt+i+1=y2)XY{Yt} XttP(Xt+i|Yt+i)=P(Xt+i+1|Yt+i+1)Yt+iYt+i+1P(Yt)

P(Xt)=YP(Xt|Yt)dP(Yt),
Xt jest również niezmienny. Innymi słowy, gdy i zbliżamy się do rozkładów stacjonarnych, , ponieważ i będą asymptotycznie czerpane z (tego samego!) rozkładu stacjonarnego . Z drugiej strony i jak poprzednio, po uwarunkowaniu i , nie będzie to dłużej obowiązywać, niezależnie od tego, jak duże jest .tP(Xt+i|Yt+i)=P(Xt+i+1|Yt+i+1)Yt+iYt+i+1P(Yt)Y t + i + 1 = y 2 tYt+i=y1Yt+i+1=y2t

Cov[Xt+i,Xt+j]Cov[Xt+i,Xt+i]

Xt+1XtXtXt+1Yt=0.8Yt1+εtεtiidN(0,1)Yt=i=0t0.8iεtiVar(Yt)=i=0t0.82i=110.82YtiidN(0,110.82)YtYt+1Yt+1YtXt

  1. Cov[Xt+i,Xt+i+1]

k()0lTlT

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.