(Poniższa odpowiedź jedynie wprowadza i stwierdza twierdzenie udowodnione w [0]. Piękno tego artykułu polega na tym, że większość argumentów jest oparta na podstawowej algebrze liniowej. Aby odpowiedzieć na to pytanie, wystarczy podać główne wyniki, ale zdecydowanie sprawdź oryginalne źródło).
W każdej sytuacji, w której wielowymiarowy wzorzec danych można opisać przez zmienny rozkład eliptyczny, wnioskowanie statystyczne z definicji sprowadza się do problemu dopasowania (i scharakteryzowania)kwektora zmiennej lokalizacji k (powiedzmy θ ) i k przez k symetryczna pół-dodatnia określona macierz (powiedzmy Σ ) do danych. Z powodów, które wyjaśnię poniżej (ale które już zakładasz jako przesłanki), często bardziej sensowne będzie rozłożenie Σ na komponent kształtu (macierz SPSD o tym samym rozmiarze co Σ ) uwzględniający kształt konturów gęstości twojego rozkładu wielowymiarowego i skalar σ SkθkkΣΣΣσS wyrażanie skali tych konturów.
W danych jednowymiarowych ( ) Σ macierz kowariancji danych jest skalarem i, jak wynika z poniższej dyskusji, komponent kształtu Σ wynosi 1, tak że Σ równa się jego składowej skali Σ = σ S zawsze i nie jest możliwa dwuznaczność.k=1ΣΣΣΣ=σS
W danych wielowymiarowych możliwy jest duży wybór funkcji skalowania Jeden w szczególności ( σ S = | ΣσS ) wyróżnia się kluczową pożądaną właściwością. To powinno sprawić, że będzie to preferowany wybór współczynnika skalowania w kontekście rodzin eliptycznych.σS=|ΣΣ|1/k
Wiele problemów w statystyce MV wiąże się z oszacowaniem macierzy rozproszenia, zdefiniowanej jako funkcja (al)
symetryczna pół dodatnia określona w R k × k i spełniająca:ΣRk×k
(dla macierzy niespecyficznych A i wektorów b ). Na przykład klasyczne oszacowanie kowariancji spełnia (0), ale w żadnym wypadku nie jest jedyne.
(0)Σ(AX+b)=AΣ(X)A⊤
Ab
W obecności eliptycznych danych rozproszonych, gdzie wszystkie kontury gęstości są elipsami zdefiniowanymi przez tę samą macierz kształtu, aż do pomnożenia przez skalar, naturalne jest rozważenie znormalizowanych wersji formy:Σ
VS=Σ/S(Σ)
gdzie jest 1-honogeniczną funkcją spełniającą:S
(1)S(λΣ)=λS(Σ)
dla wszystkich . Następnie V S nazywany jest składnikiem kształtu macierzy rozrzutu (w krótkiej macierzy kształtu), a σ S = S 1 /λ>0VSnazywa się składnik skalę matrycy rozproszenia. Przykłady problemów estymacji wielowymiarowej, w których funkcja straty zależy tylko odΣpoprzez składową kształtu V S, obejmują między innymi testy sferyczności, PCA i CCA.σS=S1/2(Σ)ΣVS
Oczywiście istnieje wiele możliwych funkcji skalowania, więc wciąż pozostaje pytanie, co (jeśli w ogóle) z kilku wyborów funkcji normalizacji jest w pewnym sensie optymalne. Na przykład:S
- (na przykład ten zaproponowany przez @amoeba w jego komentarzu poniżej pytania PO. Zobacz także [1], [2], [3])S=tr(Σ)/k
- ([4], [5], [6], [7], [8])S=|Σ|1/k
- (pierwszy wpis w macierzy kowariancji)Σ11
- (pierwsza wartość własna Σ )λ1(Σ)Σ
Jednak jest jedyną funkcją skalowania, dla której macierz informacji Fishera dla odpowiednich oszacowań skali i kształtu, w lokalnie asymptotycznie normalnych rodzinach, ma przekątną blokową (tzn. Składowe skali i kształtu problemu estymacji są asymptotycznie ortogonalne) [0 ]. Oznacza to między innymi, że funkcjonalna skala S = | Σ | 1 / k jest jedynym wyborem SS=|Σ|1/kS=|Σ|1/kS , dla których zakaz specyfikacja nie powoduje utraty wydajności podczas wykonywania wnioskowanie na V S .σSVS
Nie znam żadnej porównywalnie silnej charakterystyki optymalizacyjnej dla któregokolwiek z wielu możliwych wyborów które spełniają (1).S
- [0] Paindaveine, D., Kanoniczna definicja kształtu, Statystyki i listy prawdopodobieństwa, Tom 78, Wydanie 14, 1 października 2008, Strony 2240-2247. Nieanglowany link
- [1] Dumbgen, L. (1998). O funkcji Tylera w funkcji rozpraszania w dużym wymiarze, Ann. Inst. Statystyk. Matematyka 50, 471–491.
- [2] Ollila, E., TP Hettmansperger i H. Oja (2004). Affine ekwiwariantne metody znakowania wielowymiarowego. Preprint, University of Jyvaskyla.
- [3] Tyler, DE (1983). Właściwości dotyczące odporności i wydajności matryc rozpraszających, Biometrika 70, 411–420.
- [4] Dumbgen, L. i DE Tyler (2005). W sprawie właściwości podziału niektórych wielowymiarowych M-funkcjonałów, Scand. J. Statist. 32, 247–264.
- [5] Hallin, M. i D. Paindaveine (2008). Optymalne, oparte na rangach testy jednorodności rozproszenia, Ann. Statist., Aby się pojawić.
- [6] Salibian-Barrera, M., S. Van Aelst i G. Willems (200 6). Analiza głównych składników na podstawie wielowymiarowych estymatorów MM z szybkim i solidnym bootstrapem, J. Amer. Statystyk. Dr hab. 101, 1198–1211.
- [7] Taskinen, S., C. Croux, A. Kankainen, E. Ollila i H. O ja (2006). Funkcje wpływu i wydajności korelacji kanonicznej i estymaty wektorowe oparte na macierzach rozproszenia i kształtu, J. Multivariate Anal. 97, 359–384.
- [8] Tatsuoka, KS i DE Tyler (2000). O wyjątkowości funkcjonałów S i funkcjonałów M w nieeleptycznych rozkładach, Ann. Statystyk. 28, 1219–1243.