Zaktualizowano
Pytanie wymaga wyboru między metodą Pearsona a Spearmana, gdy kwestionowana jest normalność . Ograniczając się do tej obawy, uważam, że następujący artykuł powinien informować o każdej decyzji:
Jest całkiem miły i zapewnia przegląd znacznej literatury obejmującej dziesięciolecia na ten temat - zaczynając od „okaleczonych i zniekształconych powierzchni” Pearsona i solidności dystrybucji . Przynajmniej część sprzecznej natury „faktów” polega na tym, że znaczna część tej pracy została wykonana przed nadejściem mocy obliczeniowej - co skomplikowało rzeczy, ponieważ trzeba wziąć pod uwagę rodzaj nienormalności i trudno ją zbadać bez symulacji.r
Analiza Kowalskiego stwierdza, że rozkład nie jest solidny w obecności nienormalności i zaleca alternatywne procedury. Cały artykuł jest dość pouczający i zalecany do przeczytania, ale przejdź do bardzo krótkiego podsumowania na końcu artykułu.r
Jeśli zostanie poproszony o wybranie jednego ze Spearmana i Pearsona w przypadku naruszenia normalności, warto zalecić alternatywę bez dystrybucji, tj. Metodę Spearmana.
Wcześniej ..
Korelacja Spearmana jest miarą korelacji opartą na rangach; jest nieparametryczny i nie opiera się na założeniu normalności.
Rozkład próbkowania dla korelacji Pearsona zakłada normalność; w szczególności oznacza to, że chociaż można to obliczyć, wnioski oparte na testach istotności mogą nie być trafne.
Jak zauważa Rob w komentarzach, przy dużej próbce nie stanowi to problemu. Jednak w przypadku małych próbek, w których naruszana jest normalność, należy preferować korelację Spearmana.
Zaktualizuj Mulling nad komentarzami i odpowiedziami, wydaje mi się, że sprowadza się to do zwykłej debaty nieparametrycznej kontra testy parametryczne. Duża część literatury, np. W biostatystyce, nie dotyczy dużych próbek. Zasadniczo nie jestem kawalerska polegając na asymptotyce. Być może jest to uzasadnione w tym przypadku, ale nie jest to dla mnie oczywiste.