Jak porównać siłę dwóch korelacji Pearsona?

Recenzent zapytał mnie, czy przedstawione w tabeli korelacje Pearsona (wartości r) można ze sobą porównać, aby można było twierdzić, że jedna jest „silniejsza” od drugiej (inna niż tylko sprawdzenie rzeczywistych wartości r) .

Jak byś to zrobił? Znalazłem tę metodę

http://vassarstats.net/rdiff.html

ale nie jestem pewien, czy to dotyczy.

correlation pearson-r method-comparison

— pecorino
źródło

Czy twoje dwie korelacje są obliczane na podstawie tej samej próbki obserwacji?

— Dimitriy V. Masterov

Może działać coś w rodzaju przedziału ufności dla różnicy. Możesz użyć symulacji przy pewnych założeniach dystrybucyjnych lub asymptotycznych przybliżeniach normalnych. W dużych próbkach można użyć ładowania początkowego.

— Glen_b

AFAIK wyprowadzanie CI z wyników Z i przekształcanie wsteczne z na r dla CI na rs działa. Nawet w przypadku CI bootstrap, może być właściwe, aby je najpierw przekształcić.

— jona

(Zakładam, że mówisz o r uzyskanych z próbki.)

Test na tej stronie ma zastosowanie w tym sensie, że traktuje r jak każdy parametr, którego wartość może różnić się między dwiema populacjami. Jak to R każdy różni się od wszelkich innych środków, takich jak średnia, który jesteś bardzo pewny siebie w porównaniu z wykorzystaniem t -test? Cóż, różni się tym, że jest związany między -1,1, nie ma właściwego rozkładu, więc musisz przekształcić Fishera przed dokonaniem wnioskowania (i później przekształcić go później, jeśli chcesz np. Uzyskać CI). Wynik Z wynikający z testu ma odpowiednią formę do wnioskowania. Właśnie do tego prowadzi test, do którego się łączysz.

Więc łączysz się z procedurą wnioskowania, co mogłoby się zdarzyć, gdybyś mógł uzyskać r dla całej populacji (populacji), z której próbkujesz - czy r dla jednej grupy byłoby wyższe niż dla drugiej, czy też są dokładnie takie same? Nazwijmy to późniejszą hipotezą H $_0$ . Jeśli test zwraca niską wartość p , oznacza to, że w oparciu o próbkę powinieneś mieć małe zaufanie do hipotezy, że prawdziwa wartość różnicy między dwoma wartościami r wynosi dokładnie 0 (ponieważ takie dane występowałyby rzadko, gdyby różnica w r wynosiła dokładnie 0). Jeśli nie, nie masz danych, aby z pewnością odrzucić tę hipotezę o dokładnie równym r , ponieważ jest to prawda i / lub ponieważ twoja próbka jest niewystarczająca. Zauważ, że mogłem zrobić tę samą historię o różnicy w środkach (za pomocą testu t ) lub innej miary.

Zupełnie innym pytaniem jest, czy różnica między nimi byłaby znacząca . Niestety nie ma jednoznacznej odpowiedzi na to pytanie i żaden test statystyczny nie może dać odpowiedzi. Być może prawdziwa wartość (wartość populacji, a nie ta, którą obserwujesz) r wynosi 0,5 w jednym, a 0,47 w drugiej grupie. W tym przypadku statystyczna hipoteza ich równoważności (nasze H $_0$ ) byłoby fałszywe. Ale czy to znacząca różnica? To zależy - czy coś rzędu 3% więcej wyjaśnionej wariancji jest znaczące, czy bez znaczenia? Cohen podał przybliżone wytyczne dotyczące interpretacji r (i przypuszczalnie różnice między r ), ale zrobił to tylko pod warunkiem, że są one jedynie punktem wyjścia. I nawet nie znasz dokładnej różnicy, nawet jeśli wnioskujesz, np. Obliczając CI dla różnic między dwiema korelacjami. Najprawdopodobniej zakres możliwych różnic będzie zgodny z Twoimi danymi.

Stosunkowo bezpiecznym zakładem byłoby obliczenie przedziałów ufności dla twoich r i ewentualnie CI dla ich różnicy, i pozwolenie czytelnikowi zdecydować.

— jona
źródło

Nie wiem, czy jesteś nauczycielem, ale powinieneś. Łatwo to zrozumieć, nawet dla osób z podstawową wiedzą statystyczną, dzięki Twojemu wspaniałemu wyjaśnieniu.

— nalot lotniczy