To może być częste pytanie, ale nigdy nie znalazłem satysfakcjonującej odpowiedzi.
Jak określić prawdopodobieństwo, że hipoteza zerowa jest prawdziwa (lub fałszywa)?
Powiedzmy, że dajesz uczniom dwie różne wersje testu i chcesz sprawdzić, czy wersje były równoważne. Wykonujesz test t, który daje wartość p wynoszącą 0,02. Co za niezła wartość p! To musi oznaczać, że jest mało prawdopodobne, aby testy były równoważne, prawda? Nie. Niestety wydaje się, że P (wyniki | null) nie mówi ci P (null | wyniki). Normalną rzeczą jest odrzucenie hipotezy zerowej, gdy napotkamy niską wartość p, ale skąd wiemy, że nie odrzucamy hipotezy zerowej, która jest bardzo prawdopodobna? Aby dać głupi przykład, mogę zaprojektować test na ebolę z fałszywie dodatnim współczynnikiem 0,02: włóż 50 kulek do wiadra i napisz „ebola” na jednym. Jeśli przetestuję kogoś z tym i wybiorą piłkę „ebola”, wartość p (P (wybranie piłki | nie ma eboli)) wynosi 0,02,
Rzeczy, które do tej pory rozważałem:
- Zakładając, że P (null | wyniki) ~ = P (wyniki | null) - w przypadku niektórych ważnych aplikacji jest to oczywiście fałsz.
- Zaakceptuj lub odrzuć hipotezę, nie znając P (null | wyniki) - Dlaczego je akceptujemy lub odrzucamy? Czy nie chodzi o to, że odrzucamy to, co uważamy PRAWDOPODOBNIE za fałszywe i akceptujemy to, co PRAWDOPRAWNIE jest prawdą?
- Użyj twierdzenia Bayesa - ale jak zdobyć swoje priory? Czy nie kończysz w tym samym miejscu, próbując ustalić je eksperymentalnie? A wybór ich z góry wydaje się bardzo arbitralny.
- Znalazłem bardzo podobne pytanie tutaj: stats.stackexchange.com/questions/231580/. Jedna odpowiedź tutaj wydaje się zasadniczo mówić, że nie ma sensu pytać o prawdopodobieństwo, że hipoteza zerowa jest prawdziwa, ponieważ jest to pytanie bayesowskie. Może jestem w sercu Bayesianinem, ale nie wyobrażam sobie, żeby nie zadawać tego pytania. W rzeczywistości wydaje się, że najczęstszym nieporozumieniem dla wartości p jest to, że są one prawdopodobieństwem prawdziwej hipotezy zerowej. Jeśli naprawdę nie możesz zadać tego pytania jako częsty, to moje główne pytanie brzmi # 3: jak zdobyć swoje priory bez utknięcia w pętli?
Edycja: Dziękujemy za wszystkie przemyślane odpowiedzi. Chcę poruszyć kilka typowych tematów.
- Definicja prawdopodobieństwa: Jestem pewien, że jest na ten temat dużo literatury, ale moja naiwna koncepcja przypomina coś w rodzaju „przekonania, że doskonale racjonalna istota dostarczyłaby informacji” lub „kursów bukmacherskich, które zmaksymalizowałyby zysk, gdyby sytuacja zostało powtórzone i nieznane mogły się różnić ”.
- Czy możemy kiedykolwiek poznać P (H0 | wyniki)? Z pewnością wydaje się to trudne pytanie. Uważam jednak, że każde prawdopodobieństwo jest teoretycznie do poznania, ponieważ prawdopodobieństwo zawsze zależy od podanych informacji. Każde zdarzenie albo się wydarzy, albo nie, więc prawdopodobieństwo nie istnieje przy pełnej informacji. Istnieje tylko wtedy, gdy nie ma wystarczających informacji, więc powinno być możliwe do poznania. Na przykład, jeśli powiedzą mi, że ktoś ma monetę i zapytają o prawdopodobieństwo głów, powiedziałbym, że 50%. Może się zdarzyć, że moneta waży 70% w stosunku do głów, ale nie otrzymałem tej informacji, więc prawdopodobieństwo MASZ 50% dla informacji, które miałem, podobnie jak w przypadku lądowania na ogonie, prawdopodobieństwo BYŁO 70% głów, kiedy się tego nauczyłem. Ponieważ prawdopodobieństwo zawsze zależy od zestawu (niewystarczających) danych,
Edycja: „Zawsze” może być trochę za mocne. Mogą istnieć pytania filozoficzne, dla których nie możemy ustalić prawdopodobieństwa. Mimo to, w rzeczywistych sytuacjach, chociaż „prawie nigdy” nie możemy mieć absolutnej pewności, „prawie zawsze” powinna być najlepsza ocena.