Solidna metoda PCA (opracowana przez Candes i in. 2009 lub jeszcze lepiej Netrepalli i in. 2014 ) jest popularną metodą wykrywania zmiennych odstających na wielu odmianach , ale odległość Mahalanobisa można również zastosować do detekcji wartości odstających, biorąc pod uwagę solidną, regularną ocenę macierzy kowariancji . Jestem ciekawy (nie) zalet używania jednej metody nad drugą.
Moja intuicja mówi mi, że największe rozróżnienie między nimi jest następujące: Gdy zbiór danych jest „mały” (w sensie statystycznym), solidny PCA da kowariancję niższego rzędu, podczas gdy solidna estymacja macierzy kowariancji da zamiast tego pełny kowariancja rang spowodowana regularyzacją Ledoit-Wolf. Jak to z kolei wpływa na wykrywanie wartości odstających?