Istnieją dwie próby zrobienia dokładnie tego, co powiedziałeś w historii statystycznej, Bayesian i Fiducial. RA Fisher założył dwie szkoły myślenia statystycznego, szkołę prawdopodobieństwa zbudowaną wokół metody maksymalnego prawdopodobieństwa oraz Fiducial, która zakończyła się niepowodzeniem, ale która próbuje robić dokładnie to, co chcesz.
Krótka odpowiedź na pytanie, dlaczego zawiodła, polega na tym, że jej rozkłady prawdopodobieństwa nie zakończyły się integracją z jednością. Na koniec lekcja była taka, że wcześniejsze prawdopodobieństwo jest konieczną rzeczą, aby stworzyć to, co próbujesz stworzyć. Rzeczywiście, idziecie ścieżką jednego z największych statystów w historii, a więcej niż kilku innych wielkich umarło w nadziei na rozwiązanie tego problemu. Gdyby został znaleziony, postawiłby metody zerowej hipotezy na równi z metodami bayesowskimi pod względem rodzajów problemów, które mogłyby rozwiązać. Rzeczywiście, przepchnęłoby się obok Bayesa, chyba że istniałyby prawdziwe wcześniejsze informacje.
Chcesz również uważać na swoje oświadczenie, że wartość p wskazuje na większe prawdopodobieństwo alternatywy. Jest to prawdą tylko w szkole wyznania wiary fisheryjskiej. Nie jest to wcale prawdą w szkole dla częstych Pearson-Neyman. Twój zakład na dole wydaje się być zakładem Pearson-Neyman, podczas gdy twoja wartość p jest niezgodna, ponieważ pochodzi ze szkoły fisheryjskiej.
Aby być charytatywnym, zakładam, że w twoim przykładzie nie ma stronniczości publikacji, a więc tylko znaczące wyniki pojawiają się w czasopismach o wysokiej częstości fałszywych odkryć. Traktuję to jako losową próbkę wszystkich przeprowadzonych badań, niezależnie od wyników. Twierdziłbym, że Twoje kursy bukmacherskie nie byłyby spójne w klasycznym znaczeniu tego słowa de Finetti.
W świecie de Finetti zakład jest spójny, jeśli bukmacher nie może grać w graczy, aby ponieść pewną stratę. W najprostszej konstrukcji jest to rozwiązanie problemu krojenia ciasta. Jedna osoba przecina kawałek na pół, ale druga wybiera, który kawałek chce. W tej konstrukcji jedna osoba podałaby ceny zakładów dla każdej hipotezy, ale druga osoba wybrałaby kupno lub sprzedaż zakładu. W skrócie, możesz krótko sprzedać wartość zerową. Aby być optymalnym, szanse musiałyby być ściśle uczciwe. Wartości P nie prowadzą do uczciwych szans.
Aby to zilustrować, rozważ badanie Wetzelsa i in. Na stronie http://ejwagenmakers.com/2011/WetzelsEtAl2011_855.pdf
Cytat za co: Ruud Wetzels, Dora Matzke, Michael D. Lee, Jeffrey N. Rounder, Geoffrey J. Iverson i Eric-Jan Wagenmakers. Dowody statystyczne w psychologii eksperymentalnej: porównanie empiryczne przy użyciu testów 855 t. Perspektywy nauki psychologicznej. 6 (3) 291–298. 2011 r
Jest to bezpośrednie porównanie 855 opublikowanych testów t wykorzystujących czynniki Bayesa w celu ominięcia problemu wcześniejszej dystrybucji. W 70% wartości p pomiędzy 0,05 i 0,01 czynniki Bayesa były w najlepszym razie niepotwierdzone. Wynika to z matematycznej formy używanej przez częstych do rozwiązania problemu.
Metody hipotezy zerowej zakładają, że model jest prawdziwy, a ich konstrukcja wykorzystuje rozkład statystyczny minimaks, a nie rozkład prawdopodobieństwa. Oba te czynniki wpływają na różnice między rozwiązaniami bayesowskimi i nie bayesowskimi. Rozważmy badanie, w którym metoda bayesowska ocenia prawdopodobieństwo tylnej hipotezy jako trzy procent. Wyobraź sobie, że wartość p jest mniejsza niż pięć procent. Oba są prawdziwe, ponieważ trzy procent to mniej niż pięć procent. Niemniej jednak wartość p nie jest prawdopodobieństwem. Podaje jedynie maksymalną wartość, jaką może być prawdopodobieństwo zobaczenia danych, a nie faktyczne prawdopodobieństwo, że hipoteza jest prawdziwa lub fałszywa. Rzeczywiście, w konstrukcji wartości p nie można rozróżnić efektów ze względu na przypadek z prawdziwą wartością zerową i fałszywą wartością zerową z dobrymi danymi.
Jeśli spojrzysz na badanie Wetzela, zauważysz, że jest bardzo oczywiste, że szanse sugerowane przez wartości p nie pasują do szans sugerowanych przez miarę bayesowską. Ponieważ miara Bayesa jest zarówno dopuszczalna, jak i spójna, a nie bayesowska nie jest spójna, nie jest bezpiecznie zakładać mapy wartości p na prawdziwe prawdopodobieństwa. Wymuszone założenie, że wartość zerowa jest prawidłowa, zapewnia dobre prawdopodobieństwo pokrycia, ale nie daje dobrych prawdopodobieństw hazardowych.
Aby lepiej zrozumieć, dlaczego, rozważ pierwszy aksjomat Coxa, że wiarygodność hipotezy można opisać liczbą rzeczywistą. W domyśle oznacza to, że wszystkie hipotezy mają rzeczywistą liczbę związaną z ich prawdopodobieństwem. W metodach hipotezy zerowej tylko null ma liczbę rzeczywistą powiązaną z prawdopodobieństwem. Hipoteza alternatywna nie została wykonana i z pewnością nie jest uzupełnieniem prawdopodobieństwa obserwacji danych, biorąc pod uwagę, że wartość null jest prawdziwa. Rzeczywiście, jeśli wartość null jest prawdziwa, to dopełnienie jest fałszywe z założenia, bez względu na dane.
Jeśli skonstruowałeś prawdopodobieństwa, używając wartości p jako podstawy swojego pomiaru, to Bayesian stosując pomiary Bayesa zawsze byłby w stanie uzyskać przewagę nad tobą. Gdyby Bayesian ustalił kursy, teoria decyzji Pearsona i Neymana dostarczyłaby oświadczenie o zakładzie lub nie zakładała się, ale nie byłyby w stanie określić kwoty zakładu. Ponieważ szanse Bayesa były uczciwe, oczekiwany zysk z zastosowania metody Pearsona i Neymana wyniósłby zero.
Rzeczywiście, badanie Wetzel jest naprawdę tym, o czym mówisz, ale z 145 mniejszą liczbą zakładów. Jeśli spojrzysz na tabelę trzecią, zobaczysz badania, w których Frequentist odrzuca zero, ale Bayesian stwierdza, że prawdopodobieństwo sprzyja zeru.