Ujmę to po prostu, ponieważ testowanie zerowej hipotezy tak naprawdę dotyczy tylko hipotezy zerowej. Ogólnie rzecz biorąc, hipoteza zerowa nie jest zwykle przedmiotem zainteresowania i może nawet nie być „status quo” - szczególnie w przypadku testowania hipotez typu regresyjnego. Często w naukach społecznych nie ma status quo, więc hipoteza zerowa może być dość dowolna. Ma to ogromną różnicę w analizie, ponieważ punkt początkowy jest niezdefiniowany, więc różne badania zaczynają się od innej hipotezy zerowej, najprawdopodobniej na podstawie wszelkich dostępnych danych. Porównaj to z czymś takim, jak prawa ruchu Newtona - sensownie jest przyjąć to za hipotezę zerową i spróbuj znaleźć lepsze teorie od tego punktu początkowego.
Ponadto wartości p nie obliczają prawidłowego prawdopodobieństwa - nie chcemy wiedzieć o prawdopodobieństwach ogona, chyba że hipoteza alternatywna jest bardziej prawdopodobna, gdy zbliżasz się do ogonów. To, czego tak naprawdę chcesz, to to, jak dobrze teoria przewiduje to, co faktycznie było widziane. Załóżmy na przykład, że przewiduję, że istnieje 50% szans na „lekki prysznic”, a mój konkurent przewiduje, że istnieje 75% szansy. To okazuje się słuszne i obserwujemy lekki deszcz. Teraz, kiedy zdecydujesz, która osoba pogodowa jest poprawna, nie powinieneś dawać mojej prognozie dodatkowego uznania za to, że daje 40% szansy na „burzę”, ani nie odbierać mojego konkurenta za dawanie „burzy” 0% szansy.
IDH
BF=P(D|HI)P(D|H¯¯¯¯¯I)
Jeśli dane są niemożliwe zważywszy, że jest fałszywe, a następnie i stajemy się pewni . Wartość p zazwyczaj daje licznik (lub jego przybliżenie / transformację). Należy jednak zauważyć, że mała wartość p stanowi dowód na wartość zerową tylko wtedy, gdy istnieje alternatywna hipoteza pasująca do danych. Możesz wymyślić sytuacje, w których wartość p wynosząca faktycznie zapewnia wsparcie dla hipotezy zerowej - tak naprawdę zależy to od alternatywy.HBF=∞H0.001
Istnieje dobrze znany i łatwo niezrozumiały przykład empiryczny, w którym moneta jest razy, a liczba głów wynosi - nieco mniej niż połowa. Model zerowy to a alternatywą jest i dla marginalnego modelu (DU = dyskretny jednolity). Wartość p dla hipotezy zerowej jest bardzo mała , więc odrzuć zerową i opublikuj, prawda? Ale spójrz na współczynnik Bayesa, podany przez:104,490,00052,263,471y∼Bin(n,0.5)y|θ∼Bin(n,θ)θ∼U(0,1)p = 0,00015y∼BetaBin(n,1,1)∼DU(0,…,n)p=0.00015
BF=(ny)2−n1n+1=(n+1)!2ny!(n−y)!=11.90
Jak to może być? Współczynnik Bayesa wspiera hipotezę zerową pomimo małej wartości p? Cóż, spójrz na alternatywę - dało to prawdopodobieństwo zaobserwowanej wartości - alternatywa nie zapewnia dobrego wyjaśnienia faktów - więc zero jest bardziej prawdopodobne, ale tylko względem alternatywy . Zauważ, że wartość null robi tylko nieznacznie lepiej niż to - . Ale to wciąż lepsze niż alternatywa.0,000000111n+1=0.00000000960.00000011
Jest to szczególnie prawdziwe w przypadku krytykowanym przez Gelmana - przetestowano tylko tak naprawdę jedną hipotezę i nie zastanawiano się zbytnio nad: a) jakie są alternatywne wyjaśnienia (w szczególności na temat mylących i nie kontrolowanych efektów), b) ile kosztują alternatywy poparte wcześniejszymi badaniami, a co najważniejsze, c) jakie przewidywania czynią (jeśli w ogóle), które zasadniczo różnią się od wartości zerowej?
Zauważ jednak, że jest niezdefiniowany i zasadniczo reprezentuje wszystkie inne hipotezy zgodne z wcześniejszymi informacjami. Jedynym sposobem, w jaki naprawdę można właściwie przetestować hipotezy, jest określenie zakresu alternatyw , które zamierzasz porównać. I nawet jeśli to zrobisz, powiedzmy, że masz , możesz zgłosić tylko fakt, że dane obsługują stosunku do tego, co określiłeś. Jeśli pominiesz ważną hipotezę z zestawu alternatyw, możesz spodziewać się nonsensownych rezultatów. Dodatkowo dana alternatywa może okazać się znacznie lepsza niż inne, ale nadal mało prawdopodobna. Jeśli masz jeden test, w którym wartość p wynosi H1,…,HKHk0,010,1H¯¯¯¯¯H1,…,HKHk0.01ale sto różnych testów, w których wartość p wynosi , jest znacznie bardziej prawdopodobne, że „najlepsza hipoteza” (najlepsza ma lepsze konotacje niż prawda) faktycznie pochodzi z grupy „prawie znaczących” wyników.0.1
Najważniejszą kwestią do podkreślenia jest to, że hipoteza nigdy nie może istnieć w oderwaniu od alternatyw. Ponieważ po określeniu teorii / modeli , zawsze możesz dodać nową hipotezę
W efekcie tego rodzaju hipoteza jest zasadniczo tym, co rozwija naukę - ktoś ma nowy pomysł / wyjaśnienie jakiegoś efektu, a następnie testuje tę nową teorię pod kątem obecnego zestawu alternatyw . Jego vs a nie tylko vs . Wersja uproszczona ma zastosowanie tylko wtedy, gdy istnieje bardzo silnie wspierana hipoteza wH K + 1 = Coś jeszcze nie pomyślano o H K + 1 H 1 , … , H K H 0 H A H 1 , … , H KK
HK+1=Something else not yet thought of
HK+1H1,…,HKH0HAH1,…,HK- tj. spośród wszystkich pomysłów i wyjaśnień, które obecnie posiadamy, wyróżnia się jedna dominująca teoria. Z pewnością nie jest to prawdą w przypadku większości dziedzin nauk społecznych / politycznych, ekonomii i psychologii.