Zakładam, że masz na myśli test F dla stosunku wariancji podczas testowania pary wariancji próbki pod kątem równości (ponieważ jest to najprostszy, który jest dość wrażliwy na normalność; test F dla ANOVA jest mniej wrażliwy)
Jeśli próbki są pobierane z rozkładów normalnych, wariancja próbki ma skalowany rozkład chi-kwadrat
Wyobraź sobie, że zamiast danych pochodzących z normalnych rozkładów, miałeś rozkład bardziej ciężki niż normalny. Wtedy uzyskałbyś zbyt wiele dużych wariancji w stosunku do tego skalowanego rozkładu chi-kwadrat, a prawdopodobieństwo wariancji próbki dostania się do skrajnego prawego ogona bardzo reaguje na ogony rozkładu, z którego zostały pobrane dane =. (Będzie też zbyt wiele małych wariancji, ale efekt jest nieco mniej wyraźny)
Teraz, jeśli obie próbki zostaną pobrane z tego cięższego rozkładu ogona, większy ogon na liczniku wytworzy nadmiar dużych wartości F, a większy ogon na mianowniku wytworzy nadmiar małych wartości F (i odwrotnie dla lewego ogona)
Oba te efekty będą prowadzić do odrzucenia w teście dwustronnym, nawet jeśli obie próbki mają tę samą wariancję . Oznacza to, że gdy rzeczywisty rozkład jest cięższy niż zwykle, rzeczywiste poziomy istotności wydają się być wyższe niż chcemy.
I odwrotnie, wyciągnięcie próbki z jaśniejszego rozkładu ogona daje rozkład wariancji próbki, który ma zbyt krótki ogon - wartości wariancji wydają się być bardziej „średnie” niż dane z rozkładów normalnych. Ponownie uderzenie jest silniejsze w dalekim górnym ogonie niż w dolnym ogonie.
Teraz, jeśli obie próbki są pobierane z tego rozkładu o mniejszej liczbie ogonów, skutkuje to nadmiarem wartości F w pobliżu mediany i zbyt małą liczbą w obu ogonach (rzeczywiste poziomy istotności będą niższe niż pożądane).
Wydaje się, że efekty te niekoniecznie znacznie się zmniejszają przy większej wielkości próby; w niektórych przypadkach wydaje się gorzej.
Tytułem częściowej ilustracji podajemy 10000 wariancji próbek (dla n=10 ) dla rozkładów normalnych, t5 i jednorodnych, skalowanych tak, aby miały taką samą średnią jak χ29 :
Trochę trudno jest zobaczyć tylny ogon, ponieważ jest stosunkowo niewielki w porównaniu ze szczytem (a dla t5 obserwacje w ogonie rozciągają się dość daleko w miejscu, w którym planowaliśmy), ale możemy zobaczyć pewien wpływ na rozkład wariancji. Być może jeszcze bardziej pouczające jest przekształcenie ich przez odwrotność chi-kwadrat cdf,
który w normalnym przypadku wygląda jednolicie (tak jak powinien), w przypadku t ma duży pik w górnym ogonie (i mniejszy w dolnym ogonie), aw jednolitym przypadku jest bardziej podobny do wzgórza, ale z szerokim pik około 0,6 do 0,8, a skrajności mają znacznie mniejsze prawdopodobieństwo niż powinny, gdybyśmy próbkowali z rozkładów normalnych.
F9,9
t5
Byłoby wiele innych przypadków do zbadania dla pełnego badania, ale to przynajmniej daje poczucie rodzaju i kierunku działania, a także tego, jak powstaje.