Kiedy odpowiednia jest transformata Z Fishera?


13

Chcę przetestować korelację próbki kątem istotności, stosując wartości p, to znaczyr

H0:ρ=0,H1:ρ0.

Zrozumiałem, że mogę użyć transformacji Z Fishera, aby to obliczyć

zobs=n32ln(1+r1r)

i znalezienie wartości p przez

p=2P(Z>zobs)

przy użyciu standardowego rozkładu normalnego.

Moje pytanie brzmi: jak duże powinno być aby była to odpowiednia transformacja? Oczywiście, musi być większe niż 3. Mój podręcznik nie wspomina o żadnych ograniczeniach, ale na slajdzie 29 niniejszej prezentacji napisano, że musi być większe niż 10. Dla danych, które rozważę, będę mieć coś w rodzaju .n n 5 n 10nnn5n10


2
Strona Wikipedii podaje standardowy błąd który jest podawany przez gdzie jest rozmiarem próbki. Potrzebujesz więc co najmniej 4 kompletnych par. Nie znam żadnych ograniczeń poza ograniczeniami dotyczącymi wielkości próby. 1 / zobs N.1/N3N
COOLSerdash

8
Nie jestem pewien, ile ufać prezentacji kogoś, kto nie potrafi przeliterować swojej nazwy uniwersytetu. Mówiąc poważniej, strzeżcie się wszystkich rad, które sugerują, że wszystko jest w porządku powyżej określonej wielkości próby, a w przeciwnym razie jest straszne. Jest to kwestia jakości aproksymacji zwiększającej się płynnie wraz z rozmiarem próbki, a także w zależności od rozkładu danych. Prosta rada to być bardzo ostrożnym, planować wszystko i sprawdzać z przedziałami ufności przy ładowaniu.
Nick Cox

1
Slajd 17 opisuje test t dla przypadku specjalnego . ρ=0
whuber

Odpowiedzi:


8

W przypadku takich pytań po prostu uruchomiłbym symulację i sprawdziłbym, czy wartości zachowują się tak, jak się tego spodziewam. Wartość jest prawdopodobieństwem losowego pobrania próbki, która odbiega co najmniej tyle samo od hipotezy zerowej, jak dane, które zaobserwowałeś, jeśli hipoteza zerowa jest prawdziwa. Gdybyśmy mieli wiele takich próbek, a jedna z nich miała wartość wynoszącą 0,04, wówczas spodziewalibyśmy się, że 4% tych próbek będzie miało wartość mniejszą niż 0,04. To samo dotyczy wszystkich innych możliwych wartości .p p ppppp

Poniżej znajduje się symulacja w Stacie. Wykresy sprawdzają, czy wartości mierzą to, co powinny mierzyć, to znaczy pokazują, o ile odsetek próbek o wartościach mniejszych od nominalnej wartości odbiega od nominalnej wartości . Jak widać, ten test jest nieco problematyczny przy tak małej liczbie obserwacji. To, czy jest to zbyt problematyczne dla twoich badań, zależy od twojego osądu.p p ppppp

clear all
set more off

program define sim, rclass
    tempname z se
    foreach i of numlist 5/10 20(10)50 {
        drop _all
        set obs `i'
        gen x = rnormal()
        gen y = rnormal()
        corr x y 
        scalar `z'  = atanh(r(rho))
        scalar `se' = 1/sqrt(r(N)-3)
        return scalar p`i' = 2*normal(-abs(`z'/`se'))
    }
end

simulate p5 =r(p5)  p6 =r(p6)  p7  =r(p7)     ///
         p8 =r(p8)  p9 =r(p9)  p10 =r(p10)    ///
         p20=r(p20) p30=r(p30) p40 =r(p40)    ///
         p50=r(p50), reps(200000) nodots: sim 

simpplot p5 p6 p7 p8 p9 p10, name(small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

wprowadź opis zdjęcia tutaj

simpplot p20 p30 p40 p50 , name(less_small, replace) ///
    scheme(s2color) ylabel(,angle(horizontal)) 

wprowadź opis zdjęcia tutaj


1
n


1

zH0:ρ=0ρrzt

H0:ρ=ρ00ρ0nnα

Punkt Nicka jest słuszny: przybliżenia i zalecenia zawsze działają w pewnym szarym obszarze.

n(tα/2s/ϵ)2tsn(1.96s/ϵ)2


4
zzz

1
zH0:ρ=ρ00t

3
ztρ=0

1
z

ϵn
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.