Bezstronny estymator przykładowej macierzy kowariancji dla punktów danych x i ∈ R d wynosi C = 1nxi∈Rdgdzie ˉ x =∑xi/njest średnią dla wszystkich punktów. Oznaczmy(xi- ˉ x )jako
C=1n−1∑i=1n(xi−x¯)(xi−x¯)⊤,
x¯=∑xi/n(xi−x¯) . The
1ziWspółczynnik
1 nie zmienia rangi, a każdy termin w sumie ma (z definicji) rangę
1, więc rdzeń pytania jest następujący:
1n−11
Dlaczego mają stopień n - 1 , a nie stopień n , gdyż wydaje się, ponieważ jesteśmy zsumowanie n rank- 1 matryc?∑ziz⊤in−1nn1
Odpowiedź jest taka, że dzieje się tak, ponieważ nie są niezależne. Z założenia ∑ z i = 0 . Więc jeśli wiesz, n - 1 z Z i wówczas jest to ostatni pozostały z n jest całkowicie zdeterminowany; nie sumujemy n niezależnych macierzy rangi- 1 , sumujemy tylko n - 1zi∑zi=0n−1ziznn1n−1 niezależnych macierzy rangi , a następnie dodajemy jeszcze jedną macierz rangi 1 , która jest całkowicie liniowo określona przez resztę. Ten ostatni dodatek nie zmienia ogólnej rangi.11
Możemy to zobaczyć bezpośrednio, jeśli przepisujemy jako z n = - n - 1 ∑ i = 1 z i , a teraz podłączamy to do powyższego wyrażenia: n ∑ i = 1 z i z ⊤ i = n - 1 ∑ i = 1 z i z ⊤ i + ( - n - 1 z i ) z∑zi=0
zn=−∑i=1n−1zi,
Teraz jest tylkon-1∑i=1nziz⊤i=∑i=1n−1ziz⊤i+(−∑i=1n−1zi)z⊤n=∑i=1n−1zi(zi−zn)⊤.
n−1 w sumie pozostało warunków i staje się jasne, że cała suma może mieć najwyżej rangę .n−1
Nawiasem mówiąc, wynik ten wskazuje, dlaczego czynnik w bezstronnym estymatorze kowariancji wynosi 1n−1 a nie .1n
n−1x¯ jest równoważne centrowaniu w powyższym argumencie algebraicznym.