Jeśli mam wielowymiarową normalną próbkę iid i zdefiniuję (który jest rodzajem odległości Mahalanobisa [kwadrat] od punktu próbki do wektora przy użyciu macierzy do ważenia), jaki jest rozkład (odległość Mahalanobisa do średnia próbki przy użyciu przykładowej macierzy kowariancji )?d 2 i ( b , A ) = ( X i - b ) ′ A - 1 ( X i - b ) a A
Patrzę na artykuł, który twierdzi, że jest to , ale jest to oczywiście błędne: zostałby uzyskany dla przy użyciu (nieznanego) średniego wektora populacji i macierz kowariancji. Po podłączeniu przykładowych analogów należy uzyskać rozkład Hotelling lub skalowany rozkład lub coś w tym rodzaju, ale nie . Nie mogłem znaleźć dokładnego wyniku ani w Muirhead (2005) , ani w Anderson (2003) , ani w Mardii, Kent i Bibby (1979, 2003) χ 2 p d 2 i ( μ , Σ ) T 2 F ( ⋅ ) χ 2 p. Najwyraźniej ci faceci nie zawracali sobie głowy diagnostyką wartości odstających, ponieważ rozkład normalny na wielu odmianach jest idealny i można go łatwo uzyskać za każdym razem, gdy zbiera się dane na wielu odmianach: - /.
Sprawy mogą być bardziej skomplikowane. Wynik rozkładu Hotelling opiera się na założeniu niezależności między częścią wektorową a częścią macierzową; Taka niezależność zachodzi dla i , ale to już nie zachodzi dla i S .ˉ X S X i S