Istnieją trzy losowe zmienne, . Trzy korelacje między trzema zmiennymi są takie same. To jest,
Jaka jest najściślejsza granica, jaką możesz dla ρ ?
Istnieją trzy losowe zmienne, . Trzy korelacje między trzema zmiennymi są takie same. To jest,
Jaka jest najściślejsza granica, jaką możesz dla ρ ?
Odpowiedzi:
Wspólna korelacja może mieć wartość ale nie . Jeśli , to nie może być równe ale w rzeczywistości wynosi . Najmniejszą wartością wspólnej korelacji trzech zmiennych losowych jest . Mówiąc bardziej ogólnie, minimalna wspólna korelacjazmiennych losowych wynosi gdy traktowane jako wektory, znajdują się na wierzchołkach simpleksu (o wymiarze) wprzestrzeniwymiarowej.
Rozważ wariancję sumy zmiennych losowych jednostek wariancji . Mamy to gdzie ˉ ń jestwartość średniazwspółczynniki korelacji. Ale ponieważ, łatwo otrzymujemy z że
Tak więc średnia wartość współczynnika korelacji wynosi co najmniej . Jeśli wszystkie współczynniki korelacji mają tę samą wartość , to ich średnia również jest równa a więc mamy to Czy możliwe są zmienne losowe, dla których wspólna wartość korelacji jest równa ? Tak. Załóżmy, że są nieskorelowanymi zmiennymi losowymi wariancji jednostek i . Następnie , podczas gdy
Najściślejsza możliwa granica to . Wszystkie takie wartości mogą się faktycznie pojawić - żadne nie jest niemożliwe.
Aby pokazać, że w wyniku nie ma nic szczególnie głębokiego lub tajemniczego, ta odpowiedź najpierw przedstawia całkowicie elementarne rozwiązanie, wymagające jedynie oczywistego faktu, że wariancje - będące oczekiwanymi wartościami kwadratów - muszą być nieujemne. Po tym następuje ogólne rozwiązanie (które wykorzystuje nieco bardziej wyrafinowane fakty algebraiczne).
Wariancja dowolnej liniowej kombinacji musi być nieujemna. Niech wariancje tych zmiennych wynoszą odpowiednio i . Wszystkie są niezerowe (w przeciwnym razie niektóre korelacje nie zostałyby zdefiniowane). Korzystając z podstawowych właściwości wariancji, możemy obliczyć
dla wszystkich liczb rzeczywistych .
Zakładając , mała manipulacja algebraiczna implikuje, że jest to równoważne z
Kwadrat po prawej stronie to stosunek dwóch średnich mocy . Elementarna mocy średniej nierówność (z wagą ) zapewnia, że stosunek nie przekracza (i będzie wynosić , gdy ). Trochę więcej algebry to sugeruje
Wyraźny przykład poniżej (obejmujący trywialne zmienne normalne ) pokazuje, że wszystkie takie wartości, , faktycznie powstają jako korelacje. W tym przykładzie użyto tylko definicji wielowymiarowych normalnych, ale w innym przypadku nie wywołuje wyników rachunku różniczkowego lub algebry liniowej.
Każda macierz korelacji jest macierzą kowariancji znormalizowanych zmiennych losowych, skąd - podobnie jak wszystkie macierze korelacji - musi być dodatnia półokreślona. Odpowiednio jego wartości własne nie są ujemne. Nakłada to prosty warunek na : nie może być mniejszy niż (i oczywiście nie może przekraczać ). Odwrotnie, każda taka rzeczywiście odpowiada macierzy korelacji pewien rozkład trivariate, potwierdzające te granice są możliwie szczelnego.
Rozważ macierz korelacji na ze wszystkimi wartościami nie przekątnymi równymi(Pytanie dotyczy przypadku ale tej uogólnienia nie jest już trudniej analizować.) Nazwijmy to Z definicji jest wartością własną, pod warunkiem, że istnieje niezerowy wektor taki że
Te wartości własne są łatwe do znalezienia w niniejszej sprawie, ponieważ
Letting , oblicz to
Niech z tylko w miejscu (dla ), oblicz to
Ponieważ znalezionych wcześniej wektorów własnych obejmuje całą przestrzeń wymiarową (dowód: łatwa redukcja rzędu pokazuje wartość bezwzględną ich wyznacznika równą , która jest niezerowa), stanowią one podstawę wszystkich wektorów własnych. W związku z tym znaleźliśmy wszystkie wartości własne i ustaliliśmy, że są to lub (te ostatnie z wielokrotnością ). Oprócz dobrze znanej nierówności spełniają wszystkie korelacje, brak negatywności pierwszej wartości własnej dodatkowo implikuje
podczas gdy brak negatywności drugiej wartości własnej nie stwarza żadnych nowych warunków.
Implikacje działają w obu kierunkach: pod warunkiem macierz jest nieujemna i dlatego jest prawidłową macierzą korelacji. Jest to na przykład macierz korelacji dla rozkładu wielomianowego. W szczególności pisz
dla odwrotności kiedy Na przykład, gdy
Niech wektor zmiennych losowych ma funkcję rozkładu
gdzie . Na przykład, gdy jest to równe
Macierz korelacji dla tych zmiennych losowych to
Kontury funkcji gęstości Od lewej do prawej . Zauważ, jak gęstość przesuwa się od koncentracji w pobliżu płaszczyzny do koncentracji w pobliżu linii .
Przypadki specjalne i można również zrealizować przez rozkłady zdegenerowane ; Nie będę wchodził w szczegóły, poza zaznaczeniem, że w pierwszym przypadku dystrybucję można uznać za obsługiwaną na hiperpłaszczyźnie , gdzie jest to suma identycznie rozmieszczonych średnich Rozkład normalny, podczas gdy w tym drugim przypadku (idealna korelacja dodatnia) jest obsługiwany na linii generowanej przez , gdzie ma średnią Rozkład normalny.
Przegląd tej analizy wyjaśnia, że macierz korelacji ma rangę a ma rangę z (ponieważ tylko jeden wektor własny ma niezerową wartość własną). Dla powoduje to degenerację macierzy korelacji w obu przypadkach. W przeciwnym razie istnienie jego odwrotności dowodzi, że nie jest on generowany.
Twoja macierz korelacji jest
Macierz jest dodatnia półfinałowa, jeśli wszyscy główni nieletni są nieujemni. Głównymi nieletnimi są wyznaczniki „północno-zachodnich” bloków macierzy, tj. 1, wyznacznik
oraz wyznacznik samej macierzy korelacji.
1 jest oczywiście dodatnia, drugim zasadniczym nieletnim jest , co nie jest ujemne dla żadnej dopuszczalnej korelacji . Wyznacznikiem całej macierzy korelacji jest
Wykres pokazuje wyznacznik funkcji w zakresie dopuszczalnych korelacji .
Widzisz, że funkcja jest nieujemna w zakresie podanym przez @stochazesthai (który możesz również sprawdzić, znajdując pierwiastki równania determinantalnego).
Istnieją zmienne losowe , i z parami korelacji tylko wtedy, gdy macierz korelacji jest dodatnia półfinałowa. Dzieje się tak tylko dla .