Korekta „wielokrotnego testowania” jest konieczna za każdym razem, gdy „napompujesz błąd typu I”: np. Jeśli wykonasz dwa testy, każdy na poziomie ufności , a dla pierwszego testujemy zerowy przeciwko alternatywnemu i drugiej hipotezie porównaniu do . α=5%H(1)0H(1)1H(2)0H(2)1
Wiemy zatem, że błędem typu I dla np. Pierwszej hipotezy jest prawdopodobieństwo fałszywego odrzucenia i jest to .H(1)0α=5%
Jeśli wykonasz dwa testy, prawdopodobieństwo, że przynajmniej jeden z nich zostanie fałszywie odrzucony, jest równe 1 minus prawdopodobieństwo, że oba zostaną zaakceptowane, więc co dla jest równe , więc błąd pierwszego typu dotyczący co najmniej jednego fałszywego odrzucenia prawie się podwoił!1−(1−α)2α=5%9.75%
W testowaniu hipotez statystycznych można znaleźć dowody statystyczne na hipotezę alternatywną tylko poprzez odrzucenie wartości zerowej, odrzucenie wartości zerowej pozwala nam wnioskować, że istnieją dowody przemawiające za hipotezą alternatywną. (patrz także Co dalej, jeśli nie odrzucimy hipotezy zerowej? ).
Zatem fałszywe odrzucenie wartości zerowej daje nam fałszywe dowody, a więc fałszywe przekonanie o „prawdzie naukowej”. Właśnie dlatego należy unikać inflacji typu I (niemal dwukrotnego błędu typu I); wyższe błędy typu I sugerują więcej fałszywych przekonań, że coś zostało naukowo udowodnione . Dlatego ludzie „kontrolują” typ Ierror na poziomie rodzinnym.
Jeśli istnieje zespół badaczy, który przeprowadza wiele testów, to za każdym razem, gdy odrzucają hipotezę zerową, dochodzą do wniosku, że znaleźli dowody statystyczne potwierdzające prawdziwość naukową. Jednak z powyższego wynika, że o wiele więcej niż tych wniosków jest fałszywie przekonanych o „prawdzie naukowej”. 5%
Zgodnie z tym samym rozumowaniem to samo dotyczy sytuacji, gdy kilka zespołów przeprowadza te testy (na tych samych danych).
Oczywiście powyższe ustalenia obowiązują tylko wtedy, gdy my zespoły pracujemy na tych samych danych . Czym różni się wtedy, gdy pracują na różnych próbkach?
Aby to wyjaśnić, weźmy prosty i bardzo nierealistyczny przykład. Nasza hipoteza zerowa jest taka, że populacja ma rozkład normalny, ze znanym a null stwierdza, że stosunku do . Weźmy poziom istotności .σH0:μ=0H1:μ≠0α=5%
Nasza próbka („dane”) to tylko jedna obserwacja, więc odrzucimy wartość zerową, gdy obserwacja będzie większa niż lub mniejsza niż .1,96 σ - 1,96 σo1.96σ−1.96σ
Popełniamy błąd typu I z prawdopodobieństwem ponieważ może się zdarzyć, że odrzucimy przypadkiem, rzeczywiście, jeśli jest prawdą (więc populacja jest normalna, a ), to jest (z prawda ) szansa, że ]. Więc nawet jeśli jest prawdą, istnieje szansa, że mamy pecha z danymi. H 0 H 0 μ = 0 H 0 o ∉ [ - 1,96 σ ; 1,96 σ H 05%H0H0μ=0H0o∉[−1.96σ;1.96σH0
Jeśli więc użyjemy tych samych danych, może się zdarzyć, że wnioski z testów oprą się na próbce, która została narysowana przy „złej szansie”. W innej próbce kontekst jest inny.