W przypadku testów t, zgodnie z większością tekstów, zakłada się, że dane populacji są zwykle rozłożone. Nie rozumiem, dlaczego tak jest. Czy test t nie wymaga jedynie, aby rozkład próbkowania średnich próbek był normalnie rozłożony, a nie populacja?
Statystyka t składa się ze stosunku dwóch wielkości, obu zmiennych losowych. Nie składa się tylko z licznika.
Aby statystyka t miała rozkład t, nie wystarczy, że średnia próbki ma rozkład normalny. Potrzebujesz również:
* (wartość zależy od tego, który test - w jednej próbce mamy )dtd=n−1
Aby te trzy rzeczy były rzeczywiście prawdziwe, potrzebujesz, aby oryginalne dane były zwykle dystrybuowane.
Jeśli jest tak, że test t ostatecznie ostatecznie wymaga normalności w rozkładzie próbkowania, populacja może wyglądać jak dowolny rozkład, prawda?
Przyjrzyjmy się przez chwilę. Aby CLT mógł utrzymać populację, musi spełniać warunki ... - populacja musi mieć rozkład, do którego ma zastosowanie CLT. Więc nie, ponieważ istnieją rozkłady populacji, do których CLT nie ma zastosowania.
Tak długo, jak istnieje rozsądna wielkość próby. Czy to nie to, co stwierdza centralne twierdzenie graniczne?
Nie, CLT tak naprawdę nie mówi ani słowa o „rozsądnej wielkości próby”.
W rzeczywistości nic nie mówi o tym, co dzieje się przy dowolnej skończonej wielkości próbki.
Myślę teraz o konkretnej dystrybucji. Jest to taki, do którego CLT z pewnością ma zastosowanie. Ale przy rozkład średniej próbki jest wyraźnie nienormalny. Wątpię jednak, aby jakakolwiek próbka w historii ludzkości zawierała w sobie tyle wartości. Więc - poza tautologią - co oznacza „rozsądny ”?n=1015n
Masz więc dwa problemy:
A. Efekt, który ludzie zwykle przypisują CLT - coraz bardziej bliskie podejście do normalności rozkładów średnich próbek przy małych / średnich rozmiarach próbek - nie jest tak naprawdę stwierdzony w CLT **.
B. „Coś, co nie jest tak dalekie od normy w liczniku”, nie wystarcza, aby uzyskać statystykę o rozkładzie T.
** (Coś w rodzaju twierdzenia Berry'ego-Esseena bardziej przypomina to, co ludzie widzą, gdy patrzą na wpływ zwiększenia wielkości próby na rozkład średnich próbek).
CLT i twierdzenie Słuckiego razem dają (o ile utrzymują wszystkie ich założenia), że od rozkład statystyki t zbliża się do normy normalnej. Nie mówi, czy dany skończony może być wystarczający do jakiegoś celu.n→∞n