Miary podobieństwa lub odległości między dwiema macierzami kowariancji


28

Czy są jakieś miary podobieństwa lub odległości między dwiema symetrycznymi macierzami kowariancji (obie o tych samych wymiarach)?

Mam tu na myśli analogie do dywergencji KL dwóch rozkładów prawdopodobieństwa lub odległości euklidesowej między wektorami, z wyjątkiem zastosowanych do macierzy. Wyobrażam sobie, że byłoby całkiem sporo pomiarów podobieństwa.

Idealnie chciałbym również przetestować hipotezę zerową, że dwie macierze kowariancji są identyczne.


3
odpowiedzi na to pytanie: quant.stackexchange.com/q/121/108 mogą być przydatne.
shabbychef

2
doskonałe pytanie i odpowiedź na link - dzięki - tak właśnie tam jechałem :)
Ram Ahluwalia

Odpowiedzi:


21

ABpi,j(aijbij)2L2(AB)212[tr(A1B)ln(|B|/|A|)]

Edycja: jeśli jedna z macierzy jest macierzą implikowaną przez model, a druga to przykładowa macierz kowariancji, wówczas oczywiście można utworzyć test współczynnika prawdopodobieństwa między nimi. Mój osobisty ulubiony zbiór takich testów dla prostych struktur znajduje się w Rencher (2002) Methods of Multivariate Analysis . Bardziej zaawansowane przypadki są uwzględnione w modelowaniu struktury kowariancji, na którym rozsądnym punktem wyjścia są równania strukturalne Bollena (1989) z ukrytymi zmiennymi .


mam problem z : nie daje tej samej wartości, jeśli permutujesz i (rzeczywista odległość powinna być symetryczna). 1/2(tr(A1B)log(|B|/|A|)) BAB
user603,

mam problem z : to nie jest afiniczne ekwiwariantne (jeśli obrócisz matryce, tam zmiany odległości!). Ponadto należy w jakiś sposób skalować macierze (mogą być mierzone w bardzo różnych jednostkach), naturalne jest również wymaganie, aby odległość między dwiema macierzami kowariancji była taka sama jak odległość między odpowiednimi macierzami korelacji: więc sugeruję . ( A det ( A ) - 1 / p - B det ( B ) - 1 / p ) 2(AB)2(Adet(A)1/pBdet(B)1/p)2
user603,

2
Po pierwsze, KL nie jest prawdziwym dystansem i to dobrze znany fakt. Po drugie, jeśli macierze są mierzone w różnych jednostkach, nie mogą być równe.
StasK

Czy odległość KL jest podobna do współczynnika wiarygodności, czy są ze sobą powiązane?
hashmuke

7

Oznaczają i twoi matryce zarówno od wymiarów .Σ 2 sΣ1Σ2p

  1. Numer Cond: gdzie ( ) to największa (najmniejsza) wartość własna , gdzie jest zdefiniowany jako: λ 1 λ P Σ * Σ * Σ * : = Σ - 1 / 2 1 Σ 2 Σ - 1 / 2 1log(λ1)log(λp)λ1λpΣΣΣ:=Σ11/2Σ2Σ11/2

Edycja: Zredagowałem drugą z dwóch propozycji. Myślę, że źle zrozumiałem pytanie. Propozycja oparta na numerach warunków jest często używana w solidnych statystykach do oceny jakości dopasowania. Stare źródło, które mogłem znaleźć, to:

Yohai, VJ and Maronna, RA (1990). Maksymalne odchylenie silnych kowariancji. Komunikacja w statystyce - teoria i metody, 19, 3925–2933.

Pierwotnie uwzględniłem miarę współczynnika Det:

  1. Współczynnik : gdzie .Σ =(Σ1+Σ2)/2log(det(Σ)/det(Σ2)det(Σ1))Σ=(Σ1+Σ2)/2

która byłaby odległością Bhattacharyya między dwoma rozkładami Gaussa mającymi ten sam wektor lokalizacji. Musiałem pierwotnie odczytać pytanie odnoszące się do sytuacji, w której dwie kowariancje pochodziły z próbek z populacji, które zakładają, że mają równe środki.



Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.