Normalna podzielona przez daje ci dowód na rozkład t


10

niech i .ZN(0,1)Wχ2(s)

Jeśli i są niezależnie rozłożone, to zmienna ma rozkład ze stopniami swobody .ZWY=ZW/sts

Szukam dowodu tego faktu, referencja jest wystarczająco dobra, jeśli nie chcesz zapisać pełnego argumentu.


1
Jest to formalnie wykazane na stronie stats.stackexchange.com/questions/52906 : stosunek, gdy zapisany jest jako całka, jest postrzegany jako mieszanina Gaussów, a ta demonstracja pokazuje, że mieszanina jest w dystrybucji.
whuber

W niektórych podręcznikach jest to definicja rozkładu T. Nie musisz tego udowadniać. Jednak, jak uzyskać pdf, biorąc pod uwagę taką definicję, jest ważnym pytaniem.
mpiktas

Odpowiedzi:


12

Niech będzie losową zmienną chi-kwadrat o stopniach swobody. Następnie pierwiastek kwadratowy , jest rozkładany jako rozkład chi z stopni swobody, który ma gęstość YnYYY^n

(1)fY^(y^)=21n2Γ(n2)y^n1exp{y^22}

Określić . Następnie , a według formuły zmiany zmiennej mamy toX1nY^Y^X=n

fX(x)=fY^(nx)|Y^X|=21n2Γ(n2)(nx)n1exp{(nx)22}n

(2)=21n2Γ(n2)nn2xn1exp{n2x2}

Niech będzie standardową normalną zmienną losową, niezależną od poprzednich, i zdefiniuj zmienną losowąZ

T=ZYn=ZX
.

Zgodnie ze standardowym wzorem dla funkcji gęstości stosunku dwóch niezależnych zmiennych losowych,

fT(t)=|x|fZ(xt)fX(x)dx

Ale dla przedziału ponieważ jest nieujemnym rv Więc możemy wyeliminować wartość bezwzględną i zredukować całkę dofX(x)=0[,0]X

fT(t)=0xfZ(xt)fX(x)dx

=0x12πexp{(xt)22}21n2Γ(n2)nn2xn1exp{n2x2}dx

(3)=12π21n2Γ(n2)nn20xnexp{12(n+t2)x2}dx

Całka w wygląda obiecująco, że ostatecznie zostanie przekształcona w funkcję gęstości gamma. Granice integracji są prawidłowe, więc musimy zmanipulować integrand, aby stał się funkcją gęstości gamma bez zmiany granic. Zdefiniuj zmienną(3)

mx2dm=2xdxdx=dm2x,x=m12
Dokonanie podstawienia w całce, którą mamy

(4)I3=0xnexp{12(n+t2)m}dm2x=120mn12exp{12(n+t2)m}dm

Gęstość gamma można zapisać

Gamma(m;k,θ)=mk1exp{mθ}θkΓ(k)

Musimy mieć dopasowane współczynniki

k1=n12k=n+12,1θ=12(n+t2)θ=2(n+t2)

Dla tych wartości i terminy w całce obejmującej zmienną są jądrem o gęstości gamma. Więc jeśli podzielimy całkę przez i pomnożymy poza całkę o tej samej wielkości, całka będzie rozproszeniem gamma. funkcja i będzie równa jedności. Dlatego doszliśmy dokθ(θ)kΓ(k)

I3=12(θ)kΓ(k)=12(2n+t2)n+12Γ(n+12)=2n12nn+12Γ(n+12)(1+t2n)12(n+1)

Wstawienie powyższego do eq. otrzymujemy(3)

fT(t)=12π21n2Γ(n2)nn22n12nn+12Γ(n+12)(1+t2n)12(n+1)

=Γ[(n+1)/2]nπΓ(n/2)(1+t2n)12(n+1)

... co jest nazywane (funkcją gęstości) rozkładu t Studenta, z stopniami swobody.n


23

Chociaż ES Pearson nie lubił tego, oryginalny argument Fishera był geometryczny, prosty, przekonujący i rygorystyczny. Opiera się na niewielkiej liczbie intuicyjnych i łatwych do ustalenia faktów. Można je łatwo wizualizować, gdy lub , przy czym geometrię można wizualizować w dwóch lub trzech wymiarach. W efekcie sprowadza się to do użycia współrzędnych cylindrycznych w do analizy iid Zmienne normalne.s=1s=2Rs×Rs+1

  1. s+1 niezależne i identycznie rozmieszczone Normalne wariacje są sferycznie symetryczne. Oznacza to, że rzut promieniowy punktu na sferę jednostkową ma równomierny rozkład na .X1,,Xs+1(X1,,Xs+1)S.sRs+1S.s

  2. rozmieszczenie jest to, że suma kwadratów niezależnie średnia normalny zmiennych towarzyszących.χ2)(s)s

  3. Zatem, ustawiając i , stosunek jest styczną do szerokości geograficznej punktu w .Z=Xs+1W.=X12)++Xs2)Z/W.θ(X1,,Xs,Xs+1)Rs+1

  4. dębnikθ pozostaje niezmieniona przez rzut promieniowy na .S.s

  5. Zbiór określony przez wszystkie punkty szerokości na jest wymiarową kulą o promieniu . Jego środek wymiarowej jest więc proporcjonalna doθS.ss-1sałataθs-1

    sałatas-1θ=(1+dębnik2)θ)-(s-1)/2).

  6. Elementem różnicowym jest .re(dębnikθ)=sałata-2)θreθ=(1+dębnik2)θ)reθ

  7. Pisanie daje , skąd and Razem te równania oznaczająWłączenie współczynnika do stałej normalizującej pokazuje, że gęstość jest proporcjonalna dot=Z/W./s=sdębnikθdębnikθ=t/s

    1+t2)/s=1+dębnik2)θ
    ret=sredębnikθ=s(1+dębnik2)θ)reθ.
    reθ=1s(1+t2)/s)-1ret.
    1/sdo(s)t

    (1+dębnik2)θ)-(s-1)/2)reθ=(1+t2)/s)-(s-1)/2) (1+t2)/s)-1ret=(1+t2)/s)-(s+1)/2)ret.

To jest gęstość t Studenta.

Postać

Rycina przedstawia górną półkulę (z ) w . Skrzyżowane osie obejmują hyperplane. Czarne kropki są częścią losowej próbki standardowego rozkładu normalnego : są to wartości rzutujące na stałą podaną szerokość geograficzną , pokazane jako żółte pasmo. Gęstość tych kropek jest proporcjonalna do wymiarowej objętości tego pasma, która sama jest o promieniu . Stożek nad tym pasmem jest narysowany tak, aby kończył się na wysokości . Do współczynnikaZ0S.sRs+1W.s+1θs-1S.s-1θdębnikθs, T Studenta dystrybucyjnym stopni swobody jest podział tej wysokości, ważone środka żółtego pasma na normalizację obszaru jednostki kuli do jedności.sS.s

Nawiasem mówiąc, stała normalizująca musi wynosić (jak wspomniano wcześniej) razy względne objętości sfer ,1/s

do(s)=1s|S.s-1||S.s|=1ssπs/2)Γ(s+12)+1)(s+1)π(s+1)/2)Γ(s2)+1)=1ssπs/2)(s+1)/2)Γ(s+12))(s+1)π(s+1)/2)(s/2))Γ(s2))=Γ(s+12))sπΓ(s2)).

Końcowa ekspresji, chociaż konwencjonalna lekko maskuje estetycznie prostą początkowy ekspresyjnych, które ujawnią znaczenie, z .do(s)


Fisher wyjaśnił to pochodzenie WS Gosset (oryginalny „Student”) w liście. Gosset próbował go opublikować, dając Fishera pełne uznanie, ale Pearson odrzucił gazetę. Ostatecznie opublikowano metodę Fishera, zastosowaną do zasadniczo podobnego, ale trudniejszego problemu znalezienia rozkładu współczynnika korelacji próbki.

Bibliografia

RA Fisher, rozkład częstotliwości wartości współczynnika korelacji w próbkach z nieskończenie dużej populacji. Biometrika Vol. 10, nr 4 (maj 1915 r.), Str. 507–521. Dostępne w Internecie pod adresem https://stat.duke.edu/courses/Spring05/sta215/lec/Fish1915.pdf (oraz w wielu innych miejscach poprzez wyszukiwanie, gdy ten link zniknie).

Joan Fisher Box, Gosset, Fisher i dystrybucja t. The American Statistician , t. 35, nr 2 (maj 1981 r.), S. 61–66. Dostępne w Internecie pod adresem http://social.rollins.edu/wpsites/bio342spr13/files/2015/03/Studentttest.pdf .

EL Lehmann, Fisher, Neyman i tworzenie statystyki klasycznej. Springer (2011), rozdział 2.


To fantastyczny dowód! Mam szczerą nadzieję, że znajdziesz tę wiadomość, chociaż minęło już kilka lat. W szóstym etapie tego dowodu uważam, że wystąpił błąd. Cos ^ -2 (theta) = (1 + tan ^ 2 (theta)), a nie odwrotnie. Modlitwa jest łatwa do rozwiązania?
Entuzjasta matematyki

@Math Dziękujemy za uwagi. Nie znajduję żadnego błędu w kroku 6. Być może próbujesz odczytać „ ” (co oznacza potęgę z ), jakby to znaczyło „ "? sałata-2)(θ)-2)sałata(θ)(ArcCos(θ))2)
whuber

1
Użyłem prostej tożsamości aby wydedukować, że w wierszu 5 Ale z tego samego rozumowania w wierszu 6 . Jest to sprzeczne z twierdzeniem, że element różnicowy jest równysmido2)θ=tzan2)θ+1doosθ=(tzan2)θ+1)-1/2)doos-2)θ=smido2)θ=(tzan2)θ+1)(tzan2)θ+1)-1
Entuzjasta matematyki

@Math Dziękuję - oczywiście masz rację. Zedytowałem punkty (6) i (7), aby poprawić algebrę.
whuber

1
Uff, co za ulga! Wesołych świąt dla ciebie
entuzjasta matematyki

1

Spróbowałbym zmienić zmienne. Zestaw i , na przykład. Więc , . Następnie. Gdzie jest jakobian Matryca wieloczynnikowej funkcji i z i . Następnie możesz zintegrować out z gęstości połączenia. , , iY=ZW.sX=ZZ=XW.=sX2)Y2)faX,Y(x,y)=faZ,W.(x,sx2)y2))|det(jot)|jotZW.XYxZX=1ZY=0W.X=2)sXY2)W.Y=-2)sX2)Y3) .

jot=(10-2)sX2)Y3))

Więc . Właśnie przyjrzał się elementy teorii dystrybucji przez Thomasa A. Severini i tam, biorą . Integrowanie rzeczy staje się łatwiejsze dzięki właściwościom rozkładu Gaama. Jeśli użyję , prawdopodobnie będę musiał uzupełnić kwadraty.|det(jot)|=2)sx2)y3)X=W.X=Z

Ale nie chcę przeprowadzać obliczeń.


1
Nie głosowałem za tobą, w rzeczywistości po prostu cię głosowałem. Ale myślę, że być może głosowanie przychodziło przed edycją.
Monolite

Przepraszam za to, od tej pory będę ostrożny.
ztyh
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.