Zostawiam ten akapit, aby komentarze miały sens: Prawdopodobnie założenie o normalności w pierwotnych populacjach jest zbyt restrykcyjne i można je pominąć, koncentrując się na rozkładzie próbkowania, a także dzięki środkowej twierdzeniu granicznym, szczególnie w przypadku dużych próbek.
t
Jak wspomniałeś, rozkład t zbiega się z rozkładem normalnym wraz ze wzrostem próbki, ponieważ ten szybki wykres R pokazuje:
t
Zatem zastosowanie testu Z prawdopodobnie byłoby dobre w przypadku dużych próbek.
Rozwiązywanie problemów z moją wstępną odpowiedzią. Dziękuję, Glen_b za pomoc w OP (prawdopodobne nowe błędy w interpretacji są całkowicie moje).
- T STATYSTYCZNE OBSERWUJĄ W DYSTRYBUCJI W PODZIALE NA NORMALNOŚĆ:
Pomijając złożoność we wzorach dla jednej próby v. Dwóch prób (sparowanych i niesparowanych), ogólna statystyka t koncentrująca się na przypadku porównania średniej próbki ze średnią populacji wynosi:
test t = X¯- μsn√= X¯- μσ/ n√s2)σ2)---√= X¯- μσ/ n--√∑nx = 1( X- X¯)2)n - 1σ2)--------√(1)
Xμσ2)
- ( 1 ) ∼ N.( 1 , 0 )
- ( 1 )s2)/ σ2)n - 1∼ 1n - 1χ2)n - 1( n - 1 ) s2)/ σ2)∼ χ2)n - 1
- Licznik i mianownik powinny być niezależne.
t-statystyka ∼ t ( dfa= n - 1 )
- TEOREM LIMITU ŚRODKOWEGO:
Tendencja do normalności rozkładu próbkowania oznacza, że wraz ze wzrostem wielkości próby można uzasadnić przyjęcie normalnego rozkładu licznika, nawet jeśli populacja nie jest normalna. Nie wpływa to jednak na pozostałe dwa warunki (rozkład chi mianownika i niezależność licznika od mianownika).
Ale nie wszystko przepadło, w tym poście dyskutowane jest, w jaki sposób twierdzenie Slutzky'ego wspiera asymptotyczną zbieżność w kierunku rozkładu normalnego, nawet jeśli rozkład chi mianownika nie jest spełniony.
- KRZEPKOŚĆ:
Na papierze „Bardziej realistyczne spojrzenie na odporność i błędy typu II testu t na odchodzenie od normalności populacji” Sawilowsky SS i Blair RC w Biuletynie psychologicznym, 1992, t. 111, nr 2, 352-360 , gdzie testowali mniej idealne lub bardziej „rzeczywiste” (mniej normalne) rozkłady mocy i błędów typu I, można znaleźć następujące stwierdzenia: „Pomimo zachowawczego charakteru w odniesieniu do typu Wystąpił błąd testu t dla niektórych z tych rzeczywistych rozkładów, niewielki wpływ na poziomy mocy miały różne warunki leczenia i badane wielkości próbek. Badacze mogą łatwo zrekompensować niewielką utratę mocy, wybierając nieco większy rozmiar próbki ” .
„ Wydaje się, że dominuje pogląd, że test t niezależnych próbek jest dość solidny, o ile dotyczy to błędów typu I, w odniesieniu do kształtu populacji niegaussowskiej, o ile (a) wielkość próbek jest równa lub prawie taka sama, (b) próbka rozmiary są dość duże (Boneau, 1960, wspomina o rozmiarach próbek od 25 do 30) oraz (c) testy są raczej dwustronne niż jednostronne. Należy również pamiętać, że gdy te warunki są spełnione, a różnice między nominalną alfa a rzeczywistą alfa występują rozbieżności, które mają raczej charakter konserwatywny niż liberalny ”.
Autorzy podkreślają kontrowersyjne aspekty tego tematu i nie mogę się doczekać pracy nad niektórymi symulacjami opartymi na logarytmicznym rozkładzie, o czym wspomniał profesor Harrell. Chciałbym również przedstawić kilka porównań Monte Carlo metodami nieparametrycznymi (np. Test U Manna – Whitneya). To jest praca w toku ...
SYMULACJE:
Oświadczenie: Poniżej znajduje się jedno z tych ćwiczeń polegających na „udowodnieniu tego samemu” w ten czy inny sposób. Wyniki nie mogą być wykorzystane do uogólnień (przynajmniej nie przeze mnie), ale chyba mogę powiedzieć, że te dwie (prawdopodobnie wadliwe) symulacje MC nie wydają się zbyt zniechęcające, jeśli chodzi o zastosowanie testu t w danych okolicznościach opisane.
Błąd typu I:
n = 50μ = 0σ= 1
5 %4,5 %
W rzeczywistości wykres gęstości uzyskanych testów t wydawał się pokrywać z faktycznym pdf rozkładu t:
Najciekawszą częścią było spojrzenie na „mianownik” testu t, część, która miała być zgodna z rozkładem chi-kwadrat:
( n - 1 ) s2)/ σ2)= 98( 49( SD2)ZA+ SD2)ZA) ) / 98( eσ2)- 1 )mi2 μ + σ2)
Tutaj używamy wspólnego standardowego odchylenia, jak w tym wpisie w Wikipedii :
S.X1X2)= ( n1- 1 )S.2)X1+ ( n2)- 1 )S.2)X2)n1+ n2)- 2----------------------√
I, co zaskakujące (lub nie), fabuła była bardzo odmienna od nałożonego pdf-kwadrat chi:
Błąd i moc typu II:
109
5 %0,024 %99 %
Kod jest tutaj .