Planuję przeprowadzić badanie symulacyjne, w którym porównuję wydajność kilku solidnych technik korelacji z różnymi rozkładami (wypaczonymi, z wartościami odstającymi itp.). Przez solidne rozumiem idealny przypadek bycia odpornym na a) wypaczone rozkłady, b) wartości odstające i c) ciężkie ogony.
Wraz z korelacją Pearsona jako punktem odniesienia, myślałem o uwzględnieniu następujących bardziej solidnych miar:
- Spearman's
- Korelacja zgięcia procentowego (Wilcox, 1994, [1])
- Elipsoida minimalnej objętości, wyznacznik minimalnej kowariancji (
cov.mve
/cov.mcd
zcor=TRUE
opcją) - Prawdopodobnie korelacja winsorized
Oczywiście istnieje wiele innych opcji (zwłaszcza jeśli uwzględnisz również solidne techniki regresji), ale chcę ograniczyć się do najczęściej używanych / najbardziej obiecujących podejść.
Teraz mam trzy pytania (nie krępuj się odpowiedzieć tylko na pojedyncze):
- Czy istnieją inne solidne metody korelacji, które mógłbym / powinienem uwzględnić?
- Jakie solidne techniki korelacji są rzeczywiście stosowane w twojej dziedzinie? (Mówiąc o badaniach psychologicznych: Z wyjątkiem Spearmana , nigdy nie widziałem żadnej solidnej techniki korelacji poza dokumentem technicznym. Bootstrapowanie staje się coraz bardziej popularne, ale inne solidne statystyki do tej pory nie istniały).
- Czy znasz już systematyczne porównania wielu technik korelacji?
Skomentuj również listę metod podanych powyżej.
[1] Wilcox, RR (1994). Procentowy współczynnik korelacji zgięcia. Psychometrika , 59, 601–616.