Tło: Przedstawiam kolegom w pracy prezentację na temat testowania hipotez i rozumiem większość z nich dobrze, ale jest jeden aspekt, który wiążę się w węzły, próbując zrozumieć i wyjaśnić innym.
Tak myślę, że wiem (proszę poprawić, jeśli źle!)
- Statystyki, które byłyby normalne, gdyby wariancja była znana, postępuj zgodnie z rozkładem jeśli wariancja jest nieznana
- CLT (Central Limit Theorem): rozkład próbkowania średniej próbki jest w przybliżeniu normalny dla wystarczająco dużego (może wynosić , może być do dla silnie wypaczonych rozkładów)30 300
- Rozkład można uznać za normalny dla stopni swobody> 30
Skorzystać z -test jeżeli:
- Populacja normalna i znana wariancja (dla dowolnej wielkości próby)
- Populacja normalna, wariancja nieznana in (z powodu CLT)
- Dwumian populacji, ,n q > 10
Używasz testu jeśli:
- Populacja normalna, wariancja nieznana in
- Brak wiedzy na temat populacji lub wariancji in , ale dane próbki wyglądają normalnie / pomyślnie przechodzą testy itp., Więc populację można uznać za normalną
Pozostały mi więc:
- Dla próbek i (?), Brak wiedzy o populacji i wariancji znanych / nieznanych.< ≈ 300
Więc moje pytania to:
Przy jakiej wielkości próby można założyć (w przypadku braku wiedzy o rozkładzie populacji lub wariancji), że rozkład średniej próby jest normalny (tj. Uruchomił się CLT), gdy rozkład próby wygląda nienormalnie? Wiem, że niektóre dystrybucje potrzeba , ale niektóre środki zdają się mówić używać -test gdy ...z n > 30
W przypadkach, których nie jestem pewien, zakładam, że sprawdzam dane pod kątem normalności. Teraz, jeśli przykładowe dane wyglądają normalnie, czy używam testu (ponieważ zakładam, że populacja jest normalna, a ponieważ )?
Co z tym, gdzie przykładowe dane dla przypadków, których nie jestem pewien, nie wyglądają normalnie? Czy są jakieś okoliczności, w których nadal używałbyś testu lub testu czy zawsze starasz się przekształcić / zastosować testy nieparametryczne? Wiem, że ze względu na CLT przy pewnej wartości rozkład próbkowania średniej będzie zbliżony do normy, ale dane próbki nie powiedzą mi, co to jest wartość ; dane próbki mogą być nienormalne, podczas gdy średnia próbki jest zgodna z normą / . Czy istnieją przypadki, w których transformowałbyś / stosowałeś test nieparametryczny, podczas gdy w rzeczywistości rozkład próbkowania średniej był normalny / ale nie mogłeś powiedzieć? z n n t t