Na przykład ludzie często wybierają test nieparametryczny, gdy niektóre inne testy sugerują, że reszty nie są normalnie rozłożone. To podejście wydaje się dość powszechnie akceptowane, ale nie zgadza się z pierwszym zdaniem w tym akapicie. Miałem tylko nadzieję uzyskać wyjaśnienie w tej sprawie.
Tak, wiele osób robi takie rzeczy i zmienia swój drugi test na taki, który może poradzić sobie z heteroskedastycznością, gdy odrzuca równość wariancji i tak dalej.
To, że coś jest wspólne, nie oznacza, że jest to mądre.
Rzeczywiście, w niektórych miejscach (nie wymienię dyscyplin najgorzej obrażających) wiele z tych formalnych testów hipotez jest uzależnionych od innych formalnych testów hipotez.
Problem z robieniem tego polega na tym, że twoje procedury nie mają swoich nominalnych właściwości, a czasem nawet nie są blisko. (Z drugiej strony, zakładanie takich rzeczy bez jakiegokolwiek uwzględnienia potencjalnie ekstremalnego naruszenia może być jeszcze gorsze.)
Kilka artykułów sugeruje, że w przypadku heteroskedastycznym lepiej jest po prostu zachowywać się tak, jakby wariancje nie były równe, niż testować je i zrobić coś z tym tylko po odrzuceniu.
W przypadku normalności jest to mniej jasne. Przynajmniej w dużych próbkach, w wielu przypadkach normalność nie jest aż tak istotna (ale jak na ironię, przy dużych próbach prawdopodobieństwo testu normalności jest o wiele bardziej prawdopodobne), o ile nienormalność nie jest zbyt dzika. Jedynym wyjątkiem są przedziały prognozowania, w których naprawdę potrzebujesz, aby twoje założenie dystrybucyjne było bliskie prawicy.
Częściowo jednym z problemów jest to, że testy hipotez odpowiadają na inne pytanie niż to, na które należy odpowiedzieć. Naprawdę nie musisz wiedzieć, „czy dane są naprawdę normalne” (prawie zawsze a priori nie będzie to normalne ). Pytanie brzmi raczej „jak bardzo zakres nienormalności wpłynie na moje wnioskowanie”.
Drugi problem jest zwykle albo prawie niezależny od wielkości próbki, albo faktycznie poprawia się wraz ze wzrostem wielkości próbki - jednak testy hipotez prawie zawsze będą odrzucane przy dużych próbkach.
Istnieje wiele sytuacji, w których istnieją solidne lub nawet pozbawione dystrybucji procedury, które są bardzo bliskie w pełni wydajnemu nawet w normalnym (i potencjalnie znacznie bardziej wydajnym przy niektórych dość skromnych odstępstwach od niego) - w wielu przypadkach wydawałoby się głupie nie przyjmować takie samo ostrożne podejście.