Aby wyjaśnić związek z tytułem, nie używamy rozkładu t do oszacowania średniej (przynajmniej w sensie oszacowania punktowego), ale do skonstruowania przedziału dla niego.
Ale po co używać oszacowania, kiedy dokładnie można uzyskać przedział ufności?
To dobre pytanie (o ile nie przykładamy zbytniej wagi do „dokładnie”, ponieważ założenia są takie dokładnie podzielony na t, tak naprawdę się nie utrzymają).
„Musisz użyć tabeli rozkładu t, gdy problemy robocze występują, gdy odchylenie standardowe populacji (σ) nie jest znane, a wielkość próby jest niewielka (n <30)”
Dlaczego ludzie nie używają rozkładu T przez cały czas, gdy odchylenie standardowe populacji nie jest znane (nawet gdy n> 30)?
Uważam tę radę za - w najlepszym razie - potencjalnie wprowadzającą w błąd. W niektórych sytuacjach rozkład t powinien być nadal stosowany, gdy stopnie swobody są znacznie większe niż to.
To, gdzie normalne jest rozsądne przybliżenie, zależy od różnych rzeczy (a więc zależy od sytuacji). Ponieważ jednak (z komputerami) wcale nie jest trudno po prostu użyć t , nawet jeśli df są bardzo duże, będziesz musiał się zastanawiać, dlaczego musisz martwić się zrobieniem czegoś innego przy n = 30.
Jeśli rozmiary próbek są naprawdę duże, nie zrobi to zauważalnej różnicy w przedziale ufności, ale nie sądzę, aby n = 30 zawsze było wystarczająco blisko „naprawdę dużego”.
Jest jedna okoliczność, w której warto zastosować normalną zamiast t - wtedy twoje dane wyraźnie nie spełniają warunków, aby uzyskać rozkład t, ale nadal możesz argumentować za przybliżoną normalnością średniej (jeśli n jest dość duży). Jednak w tych okolicznościach często t jest dobrym przybliżeniem w praktyce i może być nieco „bezpieczniejsze”. [W takiej sytuacji mogę być skłonny do zbadania sprawy za pomocą symulacji.]