Testy istotności dla korelacji
Istnieją testy o znaczeniu statystycznym, które można zastosować do poszczególnych korelacji, które wskazują prawdopodobieństwo uzyskania korelacji tak dużej lub większej niż korelacja próbki, przy założeniu, że hipoteza zerowa jest prawdziwa.
Kluczową kwestią jest to, że to, co stanowi statystycznie istotny współczynnik korelacji, zależy od:
- Wielkość próbki próby: większe rozmiary próby doprowadzą do mniejszych progów
- alfa : często ustawione na 0,05, mniejsze alfy doprowadzą do wyższych progów istotności statystycznej
- test jednostronny / dwustronny : Zgaduję, że używałbyś więc to chyba nie ma znaczenia
- rodzaj współczynnika korelacji : Zgaduję, że używasz Pearsona
- dystrybucyjne założenia x i y
W typowych okolicznościach, gdy alfa wynosi 0,05, przy zastosowaniu testu dwustronnego, z korelacją Pearsona, i gdzie normalność jest co najmniej odpowiednim przybliżeniem, głównym czynnikiem wpływającym na wartość odcięcia jest wielkość próbki.
Próg ważności
Innym sposobem interpretacji pytania jest rozważenie, czy nie jesteś zainteresowany tym, czy korelacja jest istotna statystycznie, ale raczej, czy jest ona praktycznie ważna.
Niektórzy badacze zaproponowali praktyczne reguły interpretacji znaczenia współczynników korelacji, ale te reguły są specyficzne dla danej dziedziny.
Testy wielokrotnego znaczenia
k ( k - 1 ) / 2k 14 ( 13 ) / 2 = 91 Jeśli hipoteza zerowa byłaby prawdziwa dla wszystkich korelacji w macierzy, wówczas uruchamiałeś testy istotności , tym bardziej prawdopodobne jest, że popełnisz błąd typu I. Np. w twoim przypadku zrobiłbyś to średnio91 ∗ .05 = 4,55 Błędy typu I, jeśli hipoteza zerowa była prawdziwa dla wszystkich korelacji.
Jak zauważył @ user603, kwestie te zostały dobrze omówione we wcześniejszym pytaniu .
Zasadniczo uważam, że przydatne jest interpretowanie macierzy korelacji w celu skupienia się na strukturze wyższego poziomu. Można to zrobić w nieformalny sposób, patrząc na ogólne wzorce w macierzy korelacji. Można to zrobić bardziej formalnie, stosując techniki takie jak PCA i analiza czynnikowa. Takie podejście pozwala uniknąć wielu problemów związanych z testowaniem wielu znaczeń.