Czy wartości p dla testu korelacji Pearsona można obliczyć na podstawie współczynnika korelacji i wielkości próby?


12

Tło: Przeczytałem jeden artykuł, w którym autorzy podają korelację Pearsona 0,754 z wielkości próby 878. Wynikowa wartość p dla testu korelacji jest znacząca dla „dwóch gwiazdek” (tj. P <0,01). Myślę jednak, że przy tak dużej próbce odpowiadająca jej wartość p powinna być mniejsza niż 0,001 (tj. Znacząca trzy gwiazdki).

  • Czy wartości p dla tego testu można obliczyć tylko na podstawie współczynnika korelacji Pearsona i wielkości próbki?
  • Jeśli tak, jak to zrobić w R?

Odpowiedzi:


14

Tak, można to zrobić, jeśli użyjesz transformacji F-to-z Fishera. Inne metody (np. Bootstrap) mogą mieć pewne zalety, ale wymagają oryginalnych danych. W R ( r jest współczynnikiem korelacji próbki, n jest liczbą obserwacji):

z <- 0.5 * log((1+r)/(1-r))
zse <- 1/sqrt(n-3)
min(pnorm(z, sd=zse), pnorm(z, lower.tail=F, sd=zse))*2

Zobacz także ten post na moim blogu .

To powiedziawszy, czy to .01 czy .001 nie ma aż tak wielkiego znaczenia. Jak powiedziałeś, jest to głównie funkcja wielkości próby i już wiesz, że wielkość próby jest duża. Logiczny wniosek jest taki, że prawdopodobnie wcale nie potrzebujesz testu (zwłaszcza nie jest to test tak zwanej „zerowej” hipotezy, że korelacja wynosi 0). Dzięki N = 878 możesz być całkowicie pewny precyzji szacunku i skupić się na jego bezpośredniej interpretacji (tj. Czy 0,75 jest duży w twojej dziedzinie?).

Formalnie jednak, kiedy przeprowadzasz test statystyczny w ramach Neyman-Pearson, musisz wcześniej określić poziom błędu. Tak więc, jeśli wyniki testu naprawdę mają znaczenie, a badanie zaplanowano z 0,01 jako progiem, sensowne jest jedynie raportowanie p <.01 i nie powinieneś oportunistycznie ustawiać go na p <0,001 na podstawie uzyskanej wartości p . Ten rodzaj nieujawnionej elastyczności jest nawet jednym z głównych powodów krytyki małych gwiazd i, bardziej ogólnie, sposobu, w jaki testowanie znaczenia zerowej hipotezy jest praktykowane w naukach społecznych.

Zobacz także Meehl, PE (1978). Teoretyczne zagrożenia i tabelaryczne gwiazdki: Sir Karl, Sir Ronald i powolny postęp miękkiej psychologii. Journal of Consulting and Clinical Psychology, 46 (4), 806-834. (Tytuł zawiera odniesienie do tych „gwiazd”, ale treść jest znacznie szerszą dyskusją na temat roli testu istotności.)


1
Prawdopodobnie radziłbym im zrezygnować z małych gwiazdek, nawet jeśli wyniki są prawidłowe, ale rozumiem twój punkt widzenia.
Gala

1
Zredagowałem swoją odpowiedź, aby dodać uwagę na temat tego problemu. Zauważ, że 0,001 <0,01, więc autorzy są formalnie „poprawni” w każdym przypadku, bardziej zależy to od sposobu, w jaki raportowane są wyniki. Sądzę, że w przeciwieństwie do oczywistego błędu, który recenzent powinien oczywiście poprawić, kwestię tę należy pozostawić autorom.
Gala

1
Masz rację, ale do tej pory nigdy nie widziałem zgłaszania p <0,01, jeśli p jest faktycznie mniejsze niż 0,001 (nie mówiąc, że poziom ufności dla artykułu wynosi 0,01). Co więcej, w artykule, o którym mówię, autorzy podają 30 testów korelacji opartych na wielkościach prób w zakresie od 837 do 886 z korelacjami w zakresie od 0,145 do 0,754 i wszystkie są przedstawione jako znaczące w dwóch gwiazdkach.
Miroslav Sabo

1
Mam problem z opublikowaniem tutaj kodu, ale uruchamiam symulacje, a wartość p z twojego kodu nie jest taka sama jak wartość p z cor.test.
Miroslav Sabo

4
Napisałem samouczek dotyczący użycia Z z Fishera do korelacji dostępny na stata-journal.com/sjpdf.html?articlenum=pr0041 Zalecam częstsze stosowanie przedziałów ufności i obliczyć 0,724, 0,781 jako limity 95%. Poleciłbym jeszcze bardziej przyjrzeć się danym i wypracować regresję.
Nick Cox

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.