Krótko mówiąc, argument Birnbauma jest taki, że dwie szeroko akceptowane zasady logicznie sugerują, że zasada prawdopodobieństwa musi obowiązywać. Kontrargumentem Mayo jest to, że dowód jest błędny, ponieważ Birnbaum niewłaściwie stosuje jedną z zasad.
Poniżej upraszczam argumenty do tego stopnia, że nie są one zbyt rygorystyczne. Moim celem jest udostępnienie ich szerszej publiczności, ponieważ oryginalne argumenty są bardzo techniczne. Zainteresowani czytelnicy powinni zobaczyć szczegóły w artykułach połączonych w pytaniu i w komentarzach.
W trosce o konkretności, skupię się na przypadku monety z nieznanego bias . W eksperymencie go 10 razy. W eksperymencie go, aż uzyskamy 3 „ogony”. W eksperymencie odwracamy uczciwą monetę oznaczoną „1” i „2”: jeśli wyląduje na „1”, wykonujemy ; jeśli wyląduje na „2”, wykonujemy . Ten przykład znacznie uprości dyskusję i pokaże logikę argumentów (oryginalne dowody są oczywiście bardziej ogólne).θE1E2EmixE1E2
Zasady:
Następujące dwie zasady są powszechnie akceptowane:
Zasada Warunkowości mówi, że powinniśmy wyciągać te same wnioski, jeśli zdecydujemy się wykonać eksperyment lub jeśli zdecydujemy się wykonać a moneta wyląduje „1”.E1Emix
Zasada wystarczalności mówi, że powinniśmy wyciągać te same wnioski w dwóch eksperymentach, w których wystarczająca statystyka ma tę samą wartość.
Następująca zasada jest akceptowana przez Bayesian, ale nie przez częstych. Jednak Birnbaum twierdzi, że jest to logiczna konsekwencja dwóch pierwszych.
Zasada wiarygodności mówi, że powinniśmy wyciągnąć te same wnioski w dwóch eksperymentach, w których funkcje prawdopodobieństwa są proporcjonalne.
Twierdzenie Birnbauma:
Załóżmy, że wykonujemy i uzyskujemy 7 „głów” z dziesięciu rzutów. Funkcja prawdopodobieństwa to . Wykonujemy i monetą 10 razy, aby uzyskać 3 „ogony”. Funkcja prawdopodobieństwa to . Dwie funkcje wiarygodności są proporcjonalne.E1θ(103)θ7(1−θ)3E2θ(97)θ7(1−θ)3
Birnbaum uważa następującą statystykę z do :
gdzie i są odpowiednio liczbami „głów” i „ogonów”. Bez względu na to, co się stanie, zgłasza wynik tak, jakby pochodził z eksperymentu . Okazuje się, że jest wystarczające dla w . Jedyny przypadek, który nie jest trywialny, gdy , a , gdzie mamyEmix{1,2}×N2{1,2}×N2T:(ξ,x,y)→(1,x,y),
xyTE1TθEmixx=7y=3
P(Xmix=(1,x,y)|T=(1,x,y))=0.5×(103)θ7(1−θ)30.5×(103)θ7(1−θ)3+0.5×(97)θ7(1−θ)3=(103)(103)+(97).
Wszystkie pozostałe przypadki mają wartość 0 lub 1 - z wyjątkiem , co stanowi uzupełnienie powyższego prawdopodobieństwa. Rozkład danego jest niezależny od , więc jest wystarczającą statystyką dla .P(Xmix=(2,x,y)|T=(1,x,y))XmixTθTθ
Teraz, zgodnie z zasadą wystarczalności, musimy zawrzeć to samo dla i w , a od zasady słabej warunkowości musimy to samo zawrzeć dla w i w , a także dla w i w . Nasz wniosek musi być taki sam we wszystkich przypadkach, co stanowi zasadę prawdopodobieństwa.(1,x,y)(2,x,y)Emix(x,y)E1(1,x,y)Emix(x,y)E2(2,x,y)Emix
Kontrwywiad Mayo:
Układ Birnbauma nie jest eksperymentem mieszanym, ponieważ nie zaobserwowano wyniku monety oznaczonej „1” i „2” , dlatego zasada słabej warunkowości nie ma zastosowania w tym przypadku .
Podejmij test kontra i wyciągnij wniosek z wartości p testu. Na wstępie należy zauważyć, że wartość p w jest podana przez rozkład dwumianowy jako około ; wartość p w jest podana przez ujemny rozkład dwumianowy jako około .θ=0.5θ>0.5(7,3)E10.1719(7,3)E20.0898
Oto ważna część: wartość p w jest podana jako średnia z dwóch - pamiętaj, że nie znamy statusu monety - tj. Około . Jednak wartość p w - tam, gdzie obserwuje się monetę - jest taka sama jak w , tj. Około . Zasada słabej warunkowości obowiązuje (wniosek jest taki sam w i gdzie moneta wyląduje na „1”), a jednak zasada prawdopodobieństwa nie. Kontrprzykład obala twierdzenie Birnbauma.T=(1,7,3)Emix0.1309(1,7,3)EmixE10.1719E1Emix
Obalenie przez Peoę i Bergera kontrwywiadu Mayo:
Mayo domyślnie zmieniła stwierdzenie zasady wystarczalności: interpretuje „te same wnioski” jako „tę samą metodę”. Przyjmowanie wartości p jest metodą wnioskowania, ale nie wnioskiem.
Zasada wystarczalności mówi, że jeśli istnieje wystarczająca statystyka, wówczas wnioski muszą być takie same, ale wcale nie wymaga to wystarczającej statystyki. Gdyby tak było, doprowadziłoby to do sprzeczności, jak wykazał Mayo.