Wypełnianie macierzy korelacji 3x3: dwa podane współczynniki


20

Zadano mi to pytanie w wywiadzie.

Powiedzmy, że mamy macierz korelacji w postaci

[10.60,80,61γ0,8γ1]

Poproszono mnie o znalezienie wartości gamma, biorąc pod uwagę tę macierz korelacji.
Pomyślałem, że mogę coś zrobić z wartościami własnymi, ponieważ wszystkie powinny być większe lub równe 0. (Macierz powinna być dodatnia półfinałowa) - ale nie sądzę, że to podejście da odpowiedź. Brakuje mi sztuczki.

Czy możesz podać wskazówkę dotyczącą rozwiązania tego samego?


Komentarze nie są przeznaczone do rozszerzonej dyskusji; ta rozmowa została przeniesiona do czatu .
whuber

1
Przeszukiwanie tej witryny doprowadziło bezpośrednio do jednego z (kilku) wątków zawierających odpowiednie formuły: stats.stackexchange.com/questions/5747 . W odpowiedzi felixa znajduje się również kilka przydatnych wykresów .
whuber

Odpowiedzi:


21

Wiemy już, że jest ograniczona między Macierz korelacji powinna być dodatnia półfinałowa, a zatem jej główni nieletni powinni być nieujemni[ - 1 , 1 ]γ[1,1]

Tak więc

1(1γ2)0.6(0.60.8γ)+0.8(0.6γ0.8)0γ2+0.96γ0γ(γ0.96)0 and 1γ10γ0.96

4
@novice Możesz przeczytać o Kryterium Sylwestra
prawy krzyżyk

Świetna odpowiedź. Dodałbym następujące: Popularnym sposobem uzyskiwania gamma jest próba znalezienia gammy, która prowadziłaby do macierzy korelacji najmniejszej normy jądrowej (znanej również jako norma ky-fan) przy rozwiązywaniu powyższych równań. Aby uzyskać więcej informacji, wyszukaj „uzupełnienie macierzy”, „wykrywanie kompresji” lub sprawdź ten raport na temat bit.ly/2iwY1nW .
Mustafa S Eisa

1
Aby to być dowodem, potrzebujesz wyniku w innym kierunku: jeśli wszystkie nietrywialne wiodące nieletnie mają a macierz ma wyznacznik 0 , to macierz jest dodatnia półfinałowa. >00
Federico Poloni

10

Oto prostsze (i być może bardziej intuicyjne) rozwiązanie:

Pomyśl o kowariancji jako wewnętrznym produkcie nad abstrakcyjną przestrzenią wektorową . Następnie, wpisy w macierzy korelacji do wektorów v 1 , V, 2 , v 3 , w którym kątownik v i , v j oznacza kąt pomiędzy v ı i v j .sałatavja,vjotv1v2)v3)vja,vjotvjavjot

To nie jest trudne do wizualizacji, które jest ograniczony przez | V 1 , V, 2± v 1 , v 3| . W związku z tym cosinus ( ) jest więc . Podstawowa trygonometria daje wtedy .v2),v3)|v1,v2)±v1,v3)|γsałata[v1,v2)±v1,v3)]γ[0.6×0.80.6×0.8,0.6×0.8+0.6×0.8]=[0,0.96]

Edycja: Należy pamiętać, że w ostatnim wierszu jest naprawdę cos v 1 , v 2cos v 1 , v 3grzech v 1 , v 3grzech v 1 , v 2 - drugie pojawienie się 0,6 i 0,8 następuje przypadkowo dzięki 0,6 2 + 0,8 2 = 10.6×0.80.6×0,8cosv1,v2cosv1,v3sinv1,v3sinv1,v20.62+0.82=1.


1
+1, Uzasadnione geometryczne rozumowanie (mówiąc to, nie sprawdziłem jednak twoich obliczeń). Właśnie to zaproponowałem w komentarzach do pytania (niestety, wszystkie komentarze zostały przeniesione przez moderatora na czat, patrz link powyżej).
ttnphns

Wydaje mi się, że „udowodniłeś”, że wszystkie korelacje muszą być nieujemne, ponieważ wydaje się, że twoje obliczenia zawsze dają zero dla dolnej granicy. Jeśli tak nie jest, czy możesz rozwinąć ogólne zasady działania obliczeń? Naprawdę nie ufam - a może nie rozumiem - twojej granicy, ponieważ w trzech lub więcej wymiarach zawsze możesz znaleźć dla którego oba v 1v 2 = v 1v 3 = 0, a następnie twoja granica oznacza v 2v 3 jest zawsze równe zero! (cc @ttnphns)v1v1v2=v1v3=0v2v3
whuber

@whuber: Przepraszam za zamieszanie. Obliczenia nie zawsze dają zero dla dolnej granicy. Poprawiłem swoją odpowiedź.
yangle

Jak reagujesz na moją ostatnią troskę? Wygląda na to, że Twoje granice są nieprawidłowe.
whuber

@whuber: W twoim przypadku ⟨v1, v2⟩ = ⟨v1, v3⟩ = π / 2, stąd granica | ⟨v1, v2⟩ ± ⟨v1, v3⟩ | wynosi [0, π] zgodnie z oczekiwaniami. Związane cos⟨v1, v2⟩cos⟨v1, v3⟩∓sin⟨v1, v3⟩sin⟨v1, v2⟩ na γ również działa na [-1, 1].
yangle

4

Oto, co miałem na myśli w moim początkowym komentarzu do odpowiedzi i co postrzegam @yangle może mówić (chociaż nie śledziłem / nie sprawdziłem ich obliczeń).

„Matryca powinna być dodatnia półfinałowa” oznacza, że wektory zmienne są wiązką w przestrzeni euklidesowej. Przypadek macierzy korelacji jest łatwiejszy niż macierzy kowariancji, ponieważ trzy długości wektorów są ustalone na 1. Wyobraź sobie 3 wektory jednostkowe XYZ i pamiętaj, że jest cosinus kąta . Zatem cos α = r x y = 0,6 , a cos β = r y z = 0,8 . Jakie mogą być granice dla cos γ = r x zrcosα=rxy=0,6sałataβ=ryz=0,8sałataγ=rxz? Korelacja ta może przyjmować dowolną wartość zdefiniowaną przez Z, opisującą Y (utrzymując przy tym kąt ):ryz=0.8

wprowadź opis zdjęcia tutaj

Gdy się obraca, dwie pozycje są niezwykłe jako ostateczne wrt X, obie mają miejsce, gdy Z wpada do płaszczyzny XY. Jeden znajduje się między X i Y, a drugi znajduje się po przeciwnej stronie Y. Są one pokazane przez wektory niebieskie i czerwone. W obu tych pozycjach dokładnie konfiguracja XYZ (macierz korelacji) jest pojedyncza. A są to minimalny i maksymalny kąt (stąd korelacja) Z może osiągnąć wrt X.

Wybierając wzór trygonometryczny w celu obliczenia sumy lub różnicy kątów na płaszczyźnie, mamy:

jako granice.cosγ=rxyryz(1rxy2)(1ryz2)=[0,0.96]

Ten widok geometryczny jest kolejnym (a konkretnym i prostszym w przypadku 3D) spojrzeniem na to, co @rightskewed wyraził w kategoriach algebraicznych (nieletni itp.).


Jeśli X, Y, Z są zmiennymi losowymi, w jaki sposób zamapujesz je na wektory w przestrzeni 3d (mogą to być tylko wektory w przestrzeni 1d). Także jeśli RV to Nx1, to czy będą wektorami w N wymiarowej przestrzeni?
nowicjusz

@novice Tak, początkowo są to 3 wektory w przestrzeni Nd, ale tylko 3 wymiary są nieistotne. Kliknij drugi link w odpowiedzi i przeczytaj dalsze odniesienie do obszaru tematycznego, w którym jest wyjaśnione.
ttnphns

4

Zabawa z głównymi nieletnimi może być w porządku na problemach 3 na 3 lub 4 na 4, ale zabraknie gazu i stabilności liczbowej w wyższych wymiarach.

W przypadku pojedynczego problemu „wolnego” parametru, takiego jak ten, łatwo zauważyć, że zestaw wszystkich wartości tworzących psd macierzy będzie pojedynczym interwałem. Dlatego wystarczy znaleźć minimum i maksimum takich wartości. Można to łatwo osiągnąć, rozwiązując numerycznie parę problemów z liniowym programowaniem SemiDefinite (SDP):

  1. minimalizacja γ podlegająca matrycy to psd.
  2. maksymalizacja γ zależna od macierzy to psd.

Na przykład problemy te można formułować i rozwiązywać numerycznie, używając YALMIP w MATLAB.

  1. gamma = sdpvar; A = [1, 6, 8; .6 1 gamma; 0,8 gamma 1]; optymalizuj (A> = 0, gamma)
  2. optymalizuj (A> = 0, -gamma)

Szybki, łatwy i niezawodny.

BTW, jeśli smarty ankieter spodni zadający pytanie, nie wie, że programowanie SemiDefinite, które jest dobrze rozwinięte i ma wyrafinowane i łatwe w użyciu optymalizatory numeryczne do niezawodnego rozwiązywania problemów praktycznych, może być użyte do rozwiązania tego problemu, i wiele więcej trudne warianty, powiedz mu, że to już nie 1870 rok, i czas skorzystać z nowoczesnych osiągnięć obliczeniowych.


4

Rozważmy następujący zestaw wypukły

{(x,y,z)R3:[1xyx1zyz1]O3}

3

wprowadź opis zdjęcia tutaj

x=0.6y=0.8

wprowadź opis zdjęcia tutaj

Granicą eliptopu jest sześcienna powierzchnia określona przez

det[1xyx1zyz1]=1+2xyzx2y2z2=0

x=0.6y=0.8

0.96zz2=z(0.96z)=0

Zatem przecięcie eliptopu z dwiema płaszczyznami jest parametryzowanym segmentem linii

{(0.6,0.8,t)0t0.96}

1

Każda dodatnia półokreślona macierz jest macierzą korelacji / kowariancji (i odwrotnie).

ZAZAZA=UreUT.Ureb=Ure1/2)UT.re1/2)

xbxZA

R=mi[xxT.]R=RT.zaT.Rza=mi[(zaT.x)2)]0zaR

2)nn

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.