Testy istotności są tym, co wymyślił Fisher, a testy hipotez opracowali Neyman i Pearson, aby zastąpić testy istotności. Nie są one takie same i są wzajemnie niezgodne w stopniu, który zaskoczyłby większość użytkowników testów hipotezy zerowej.
Testy istotności Fishera dają wartość ap, która pokazuje, jak ekstremalne są obserwacje pod hipotezą zerową. Ta wartość p jest wskaźnikiem dowodów przeciwko hipotezie zerowej i poziomowi istotności.
Testy hipotezy Neymana i Pearsona ustanowiły zarówno hipotezę zerową, jak i hipotezę alternatywną i działają jako reguła decyzyjna dla przyjęcia hipotezy zerowej. W skrócie (jest tego więcej, niż mogę tu podać), wybierasz akceptowalny wskaźnik wnioskowania fałszywie dodatniego, alfa (zwykle 0,05), i albo akceptujesz, albo odrzucasz zero na podstawie tego, czy wartość p jest wyższa czy niższa od alfa. Musisz przestrzegać decyzji testu statystycznego, jeśli chcesz uchronić się przed fałszywie dodatnimi błędami.
Podejście Fishera pozwala ci wziąć pod uwagę wszystko, co chcesz wziąć pod uwagę przy interpretacji wyniku, na przykład wcześniej istniejące dowody mogą być nieformalnie wzięte pod uwagę przy interpretacji i prezentacji wyniku. W podejściu NP można to zrobić tylko na etapie projektowania eksperymentalnego i wydaje się, że jest rzadko wykonywane. Moim zdaniem podejście rybackie jest bardziej przydatne w podstawowej pracy naukowej niż podejście NP.
Istnieje obszerna literatura na temat niespójności między testowaniem istotności i testowaniem hipotez oraz na temat niefortunnej hybrydyzacji tych dwóch metod. Możesz zacząć od tego artykułu: Goodman, W kierunku statystyk medycznych opartych na dowodach. 1: Błąd wartości P.
http://www.ncbi.nlm.nih.gov/sites/entrez?Db=pubmed&Cmd=ShowDetailView&TermToSearch=10383371