Czy każda macierz korelacji jest dodatnia?


11

Mówię tu o macierzach korelacji Pearsona.

Często słyszałem, że mówiono, że wszystkie macierze korelacji muszą być dodatnie półfinałowe. Rozumiem, że dodatnie określone macierze muszą mieć wartości własne , podczas gdy dodatnie semidkończone macierze muszą mieć wartości własne 0 . To sprawia, że ​​myślę, że moje pytanie można przeformułować w następujący sposób: „Czy macierze korelacji mogą mieć wartość własną = 0 ?”>00=0

Czy jest możliwe, aby macierz korelacji (wygenerowana z danych empirycznych, bez brakujących danych) miała wartość własną lub wartość własną < 0 ? Co jeśli zamiast tego była to macierz korelacji populacji?=0<0

Przeczytałem na górze odpowiedź na to pytanie dotyczące macierzy kowariancji, że

Rozważmy trzy zmienne, , Y i Z = X + Y . Ich macierz kowariancji, M , nie jest określona dodatnio, ponieważ istnieje wektor z ( = ( 1 , 1 , - 1 ) ), dla którego z M z nie jest dodatni.XYZ=X+YMz=(1,1,1)zMz

Jednakże, jeśli zamiast macierzy kowariancji zrobić te obliczenia na macierzy korelacji następnie wychodzi jako pozytywne. Myślę więc, że być może sytuacja wygląda inaczej w przypadku macierzy korelacji i kowariancji.zMz

Powodem mojego pytania jest to, że zostałem zapytany o przepływ stosu w związku z pytaniem, które tam zadałem.


Jeśli na przykład dwa atrybuty są jedną rzeczą, mającą tylko różne nazwy, macierz jest pojedyncza. Jeśli dwa atrybuty dodają do stałej, jest to znowu liczba pojedyncza, i tak dalej .
ttnphns

Jeśli macierz kowariancji jest liczbą pojedynczą, macierz korelacji również jest liczbą pojedynczą.
ttnphns

2
Prawie duplikaty: czy każda macierz korelacji jest dodatnia na półokreślona? która mniej skupia się na kącie określonym względem półokreślonego i czy każda macierz kowariancji jest dodatnia? co jest istotne, ponieważ kowariancja jest zasadniczo przeskalowaną korelacją.
Silverfish,

Odpowiedzi:


16

Macierze korelacji nie muszą być definitywnie dodatnie.

Rozważ skalarną zmienną losową X o niezerowej wariancji. Zatem macierz korelacji X z samą sobą jest macierzą wszystkich, która jest dodatnia półokreślona, ​​ale nie dodatnia określona.

Jeśli chodzi o korelację próbek, rozważ dane przykładowe dla powyższego, mając pierwszą obserwację 1 i 1, a drugą obserwację 2 i 2. To powoduje, że korelacja próbki jest macierzą wszystkich, więc nie jest dodatnia.

Przykładowa macierz korelacji, jeśli jest obliczona z dokładną arytmetyką (tj. Bez błędu zaokrąglenia), nie może mieć ujemnych wartości własnych.


4
Warto wspomnieć o możliwym wpływie brakujących wartości na przykładową macierz korelacji . Fuzz numeryczny nie jest jedynym powodem uzyskania ujemnej wartości własnej w przykładowej macierzy korelacji / kowariancji.
Silverfish,

1
Tak, nie wyraziłem tego wyraźnie, ale zakładałem, zgodnie z pytaniem, „bez brakujących danych”. Gdy znajdziesz się w dzikim, zwariowanym świecie brakujących danych i ich korekty, wszystko idzie.
Mark L. Stone,

Tak, przepraszam, masz całkowitą rację, pytanie brzmiało „brak brakujących danych” - pomyślałem, że warto o tym wspomnieć, ponieważ przyszli poszukiwacze mogą być zainteresowani, nawet jeśli apetyt PO jest zaspokojony!
Silverfish,

7

X1=X2X1=2X2

n<pn1pn+1n1


Prawdziwe dane. Podejrzewam, że mógłbym i powinienem podać te informacje, ale moim celem było stworzenie kontrprzykładu, który obaliłby hipotezę OP, pokazując w ten sposób jej nieważność. Powinieneś jednak dostosować drugie zdanie tak, aby brzmiało: „W tym przypadku macierze kowariancji i korelacji będzie co najwyżej ranga n − 1, więc będzie co najmniej (p − n + 1) zero wartości własnych. ”
Mark L. Stone,

4

XY=2X(X,Y)2X=YE[Y2]=4E[X2]=σY2E[XY]=2E[X2]Cov(X,Y)=E[XY]EXEY=E[XY]

Λ=(1224),
Λ=(1111),
XY

2Λcov(X,Y)=E(XY)E(X)E(Y)=2E[X2]=2(σX2+[E(X)]2)E(X2)=Var(X)+[E(X)]2

diagΛ1/2ΛdiagΛ1/2

@AntoniParellada, nie jestem do końca pewien, co masz na myśli - kowariancja tutaj jest bezpośrednim obliczeniem. Ale dokonam edycji i wyjaśnię to. Dzięki.
yoki
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.