Co to jest argument argumentacyjny i dlaczego nie został przyjęty?


33

Jednym z późnych wypowiedzi RA Fishera były okresy odniesienia i zasadnicze argumenty . Podejście to nie jest jednak tak popularne, jak argumenty częste lub bayesowskie. Jaki jest argument argumentacyjny i dlaczego nie został zaakceptowany?


4
Interesujące pytanie. Sprott (2000) mówi: „Prawdopodobieństwo Fiducial nie zostało powszechnie przyjęte. Wynika to głównie z faktu, że jego nieograniczone stosowanie wywołuje sprzeczności. Dlatego ważne jest podkreślenie założeń, na których powyższe zastosowanie prawdopodobieństwa Fiducial ...” str. 77. Podaje także odniesienia do tych sprzeczności, takie jak Barnard (1987) . W tym artykule argumentowano, że Fisher „zobaczył światło” i został Bayesianinem.

3
Wydawało mi się, że przeczytałem, że Fisher nigdy nie dokończył swojej argumentacji lub przynajmniej nie zapewnił jej pełnej spójności. Artykuł AMS z 1964 r. Autorstwa Dempstera mówi: „Stwierdzono, że ogólna forma argumentu fikcyjnego jest atrakcyjna, ale wiele ograniczeń narzuconych przez Fishera jest niezręcznych lub niejednoznacznych i być może należy je zastąpić”.
Wayne

@Wayne: Odnośnik Dempstera otwiera oczy. Dzięki.
JohnRos

2
Kiedy byłem studentem Stanforda (oddając swój wiek) jakieś 35 lat temu, odbyliśmy kurs seminaryjny „O ponownym prowadzeniu Fishera”. Tytuł seminarium pochodzi z artykułu o tym tytule, który został opublikowany około rok wcześniej (być może przez Jimmie Savage). W każdym razie każdy uczeń biorący udział w seminarium na ocenę musiał przeczytać jeden z artykułów Fishera i zdać z niego raport. Mój opowiadał o słynnym problemie Behrensa-Fishera. Argument ten był wyraźny w tym artykule. Moja pamięć o pracy i klasie nie jest tak ostra, że ​​to było 35 lat temu.
Michael R. Chernick

1
Fisher zmarł w latach 60. w Australii. To było długo zanim zostałem statystykiem. Myślę, że Fisher uważał, że teoria powodzenia jest kompletna. Myślę, że inni statystycy zastrzelili w nim dziury, a on starał się go bronić. Ale jeśli przeczytałeś Fishera, wiesz, że miał zawroty głowy i zawsze był przekonany, że ma rację (chyba, że ​​tak było). Nie widziałem gazety Barnarda, ale wątpię, by Fisher kiedykolwiek zrezygnował z wnioskowania powierniczego, a także wątpię, czy został Bayesianinem.
Michael R. Chernick

Odpowiedzi:


16

Dziwi mnie, że nie uznajesz nas za władze. Oto dobre odniesienie: Encyclopedia of Biostatistics, tom 2, strona 1526; artykuł zatytułowany „Fisher, Ronald Aylmer”. Począwszy od dolnej części pierwszej kolumny na stronie i przechodząc przez większość drugiej kolumny, autorzy Joan Fisher Box (córka RA Fishera) i AWF Edwards piszą

Fisher przedstawił ten argument w 1930 r. [11] .... Natychmiast pojawiły się kontrowersje. Fisher zaproponował argument argumentacyjny jako alternatywę dla bayesowskiego argumentu o odwrotnym prawdopodobieństwie, który potępił, gdy nie można było ustalić obiektywnego wcześniejszego prawdopodobieństwa.

Następnie dyskutują o debatach z Jeffreysem i Neymanem (szczególnie z Neymanem na temat przedziałów ufności). Teoria testu hipotez Neymana-Pearsona i przedziały ufności pojawiły się w latach 30. XX wieku po artykule Fishera. Nastąpiło kluczowe zdanie.

Późniejsze trudności z argumentem zasadniczym pojawiły się w przypadkach estymacji wielowymiarowej z powodu niejednoznaczności liczb przestawnych.

W tym samym tomie Encyclopedia of Biostatistics znajduje się artykuł str. 1510-1515 zatytułowany „Fiducial Probability” autorstwa Teddy'ego Seidenfelda, który szczegółowo omawia tę metodę i porównuje interwały odniesienia z przedziałami ufności. Aby zacytować ostatni akapit tego artykułu,

Na konferencji o prawdopodobieństwie powodzenia w 1963 r. Savage napisał: „Celem prawdopodobieństwa powodzenia ... wydaje się być to, co nazywam omletem bayesowskim bez rozbijania jaj bayesowskich”. W tym sensie prawdopodobieństwo odniesienia jest niemożliwe. Podobnie jak w przypadku wielu wielkich wkładów intelektualnych, trwałą wartością jest to, czego uczymy się, próbując zrozumieć spostrzeżenia Fishera dotyczące prawdopodobieństwa odniesienia. (Zobacz Edwards [4], aby uzyskać więcej informacji na ten temat.) Na przykład jego rozwiązanie problemu Behrensa-Fishera było genialnym potraktowaniem uciążliwych parametrów przy użyciu twierdzenia Bayesa. W tym sensie „... najważniejszym argumentem jest„ uczenie się od Fishera ”[36, s. 926]. Tak interpretowany z pewnością pozostaje cennym dodatkiem do wiedzy staistycznej.

Myślę, że w ostatnich kilku zdaniach Edwards stara się rzucić korzystne światło na Fishera, mimo że jego teoria została zdyskredytowana. Jestem pewien, że można znaleźć wiele informacji na ten temat, przeglądając te encyklopedyczne i podobne artykuły w innych artykułach statystycznych, a także artykuły biograficzne i książki na temat Fishera.

Niektóre inne odniesienia

Box, J. Fisher (1978). „TA Fisher: Życie naukowca”. Wiley, New York Fisher, RA (1930) Odwrotne prawdopodobieństwo. Postępowanie z Cambridge Philosophical Society. 26, 528–535.

Bennett, redaktor JH (1990) Wnioskowanie statystyczne i analiza: wybrana korespondencja RA Fishera. Clarendon Press, Oxford.

Edwards, AWF (1995). Wnioskowanie i podstawowa teoria doboru naturalnego. Biometria 51 799–809.

Savage LJ (1963) Dyskusja. Biuletyn Międzynarodowego Instytutu Statystycznego 40, 925-927.

Seidenfeld, T. (1979). „Filozoficzne problemy wnioskowania statystycznego” Reidel, Dordrecht. Seidenfeld, T. (1992). Argumentacja RA Fischera i twierdzenie Bayesa. Nauki statystyczne 7, 358-368.

Tukey, JW (1957). Niektóre przykłady o istotnym znaczeniu. Annals of Mathematical Statistics 28, 687-695.

Zabell, SL (1992). RA Fisher i argument fiducial. Nauki statystyczne 7, 369-387.

Kokpit jest trudny do zrozumienia, ponieważ rybak ciągle go zmienia, jak powiedział Seidenfeld w swoim artykule w Encyklopedii Biostatystyki

Po publikacji w 1930 r., Przez pozostałe 32 lata swojego życia, poprzez dwie książki i liczne artykuły, Fisher niezachwianie trzymał się idei uchwyconej w (1) i rozumowania prowadzącego do niej, które możemy nazwać „wnioskowanie odwrotne” wtedy nic dziwnego, że Fisher spowodował takie zagadki swoim nowym pomysłem

Równanie (1), do którego odnosi się Seidenfeld, jest rozkładem odniesienia parametru podanego jako gdzie oznacza jednoparametrowa funkcja rozkładu skumulowanego dla zmiennej losowej przy z parametrem . Przynajmniej taka była początkowa definicja Fishera. Później został rozszerzony na wiele parametrów i właśnie w tym momencie problem zaczął się od kłopotliwego parametru w problemie Behrensa-Fishera. Tak więc rozkład odniesienia jest jak rozkład tylny dla parametru przy danych obserwowanychθxfid(θ|x)F/θF(x,θ)Xxθσθx. Ale jest skonstruowany bez uwzględnienia wcześniejszej dystrybucji na .θ

Mam problem z uzyskaniem tego wszystkiego, ale nie jest trudno go znaleźć. Naprawdę nie potrzebujemy odpowiadać na takie pytania. Wyszukiwarka Google ze słowami kluczowymi „wnioskowanie fiducial” prawdopodobnie pokazałaby wszystko, co znalazłam, i wiele więcej.

Przeprowadziłem wyszukiwanie w Google i okazało się, że profesor UNC, Jan Hannig, uogólnił wnioskowanie powodzenia, próbując je ulepszyć. Wyszukiwarka Google zawiera szereg jego ostatnich artykułów i prezentację PowerPoint. Mam zamiar skopiować i wkleić dwa ostatnie slajdy z jego prezentacji poniżej:

Uwagi końcowe

Uogólnione rozkłady powodzenia często prowadzą do atrakcyjnego rozwiązania z asymptotycznie poprawnym pokryciem częstych.

Wiele badań symulacyjnych pokazuje, że uogólnione rozwiązania odniesienia mają bardzo dobre właściwości małych próbek.

Obecna popularność wnioskowania uogólnionego w niektórych zastosowanych kręgach sugeruje, że gdyby komputery były dostępne 70 lat temu, wnioskowanie powodzenia mogłoby nie zostać odrzucone.

cytaty

Zabell (1992) „Wnioskowanie Fiducial jest jedną wielką porażką RA Fishera.” Efron (1998) „Być może największy błąd Fishera stanie się wielkim hitem w XXI wieku! „

Aby dodać więcej referencji, oto lista referencji, którą wziąłem z pracy Hanniga z 2009 roku, statystyki Sinica. Przepraszam za powtórzenie, ale myślę, że to będzie pomocne.

Burch, BD i Iyer, HK (1997). Dokładne przedziały ufności dla współczynnika wariancji (lub dziedziczności) w mieszanym modelu liniowym. Biometrics 53, 1318-1333.

Burdick, RK, Borror, CM and Montgomery, DC (2005a). Projektowanie i analiza badań R&R w miernikach. Seria ASA-SIAM na temat statystyki i prawdopodobieństwa stosowanego. Philadelphia, Pensylwania: Society for Industrial and Applied Mathematics.

Burdick, RK, Park, Y.-J., Montgomery, DC i Borror, CM (2005b). Przedziały ufności dla wskaźników błędnej klasyfikacji w badaniu R&R. J. Quality Tech. 37, 294–303.

Cai, TT (2005). Jednostronne przedziały ufności w dyskretnych rozkładach. J. Statist. Plann. Wnioskowanie 131, 63–88.

Casella, G. i Berger, RL (2002). Wnioskowanie statystyczne. Wadsworth and Brooks / Cole Advanced Books and Software, Pacific Grove, Kalifornia, drugi wyd.

Daniels, L., Burdick, RK i Quiroz, J. (2005). Przedziały ufności w badaniu R&R przy pomocy mierników stałych. J. Quality Tech. 37, 179–185.

Dawid, AP i Stone, M. (1982). Model funkcjonalny podstawy wnioskowania fiducial. Ann. Statystyk. 10, 1054–1074. Z dyskusjami GA Barnarda i DAS Frasera oraz odpowiedzią autorów.

Dawid, AP, Stone, M. and Zidek, JV (1973). Paradoksy marginalizacji w bayesowskim i wnioskowanie strukturalne. J. Roy. Statystyk. Soc. Ser. B 35, 189–233. Z dyskusją: DJ Bartholomew, AD McLaren, DV Lindley, Bradley Efron, J. Dickey, GN Wilkinson, APDempster, DV Hinkley, MR Novick, Seymour Geisser, DAS Fraser i A. Zellner, oraz odpowiedź AP Dawida, M. Stone i JV Zidek.

Dempster, AP (1966). Nowe metody wnioskowania w kierunku rozkładów bocznych na podstawie danych przykładowych. Ann. Matematyka Statystyk. 37, 355–374.

Dempster, AP (1968). Uogólnienie wnioskowania bayesowskiego. (Z dyskusją). J. Roy. Statystyk. Soc. B 30, 205–247.

Dempster, AP (2008). Rachunek Dempstera-Shafera dla statystyków. International Journal of Approximate Reasoning 48, 365-377.

E, L., Hannig, J. and Iyer, HK (2008). Przedziały czasu odniesienia dla składników wariancji w niezrównoważonym dwuskładnikowym normalnym mieszanym modelu liniowym. J. Amer. Statystyk. Doc. 103,854–865.

Efron, B. (1998). RA Fisher w XXI wieku. Statystyk. Sci. 13, 95–122. Z komentarzami i dupliką autora.

Fisher, RA (1930). Odwrotne prawdopodobieństwo. Postępowanie z Cambridge Philosophical Society XXVI, 528-535.

Fisher, RA (1933). Pojęcia prawdopodobieństwa odwrotnego i prawdopodobieństwa odniesienia odnoszące się do nieznanych parametrów. Postępowanie Royal Society of London A 139, 343-348.

Fisher, RA (1935a). Podstawowy argument w wnioskowaniu statystycznym. Ann. Eugenics VI, 91-98.

Fisher, RA (1935b). Logika wnioskowania indukcyjnego. J. Roy. Statystyk. Soc. B 98, 29–82.

Fraser, DAS (1961). Na podstawie wnioskowania. Ann. Matematyka Statystyk. 32, 661–676.

Fraser, DAS (1966). Prawdopodobieństwo strukturalne i uogólnienie. Biometrika 53, 1–9.

Fraser, DAS (1968). Struktura wnioskowania. John Wiley & Sons, New York-London- Sydney.

Fraser, DAS (2006). Wnioskowanie podstawowe. W The New Palgrave Dictionary of Economics (pod redakcją S. Durlauf i L. Blume). Palgrave Macmillan, 2. wydanie. W SPRAWIE OGÓLNEJ ODNIESIENIA FIDUCIAL 543

Ghosh, JK (1994). Asymptotyki wyższego rzędu. Regionalna seria konferencji NSF-CBMS. Hayward: Institute of Mathematical Statistics.

Ghosh, JK i Ramamoorthi, RV (2003). Bayesian Nonparametrics. Seria Springera w statystyce. Springer-Verlag, Nowy Jork.

Glagovskiy, YS (2006). Konstrukcja przedziałów ufności Fiducial dla mieszanki rozkładu Cauchyego i normalnego. Praca magisterska, Wydział Statystyki, Colorado State University.

Grundy, PM (1956). Dystrybucje podstawowe i wcześniejsze dystrybucje: przykład, w którym nie można powiązać tego pierwszego z drugim. J. Roy. Statystyk. Soc. Ser. B 18, 217-221.

GUM (1995). Przewodnik po wyrażaniu niepewności pomiaru. Międzynarodowa Organizacja Normalizacyjna (ISO), Genewa, Szwajcaria.

Hamada, M. i Weerahandi, S. (2000). Ocena systemu pomiarowego poprzez uogólnione wnioskowanie. J. Quality Tech. 32, 241–253.

Hannig, J. (1996). O rozkładach warunkowych jako granicach martingales. Mgr praca dyplomowa (w języku czeskim), Uniwersytet Karola, Praga, Republika Czeska.

Hannig, J., E, L., Abdel-Karim, A. i Iyer, HK (2006a) Równoległe uogólnione przedziały ufności dla współczynników średnich rozkładów logarytmicznych. Południowy. J. Statist. 35, 261–269.

Hannig, J., Iyer, HK i Patterson, P. (2006b) Fiducial uogólnione przedziały ufności. J. Amer. Statystyk. Doc. 101, 254–269.

Hannig, J. and Lee, TCM (2007). Uogólnione wnioskowanie fiducial dla regresji falkowej. Tech. rep., Colorado State University.

Iyer, HK i Patterson, P. (2002). Przepis na konstruowanie uogólnionych kluczowych wielkości i uogólnionych przedziałów ufności. Tech. Rep. 2002/10, Departament Statystyki, Colorado State University.

Iyer, HK, Wang, CMJ i Mathew, T. (2004). Modele i przedziały ufności dla prawdziwych wartości w badaniach międzylaboratoryjnych. J. Amer. Statystyk. Doc. 99, 1060–1071.

Jeffreys, H. (1940). Uwaga na wzór Behrensa-Fishera. Ann. Eugenics 10, 48-51.

Jeffreys, H. (1961). Teoria prawdopodobieństwa. Clarendon Press, Oxford, trzeci edn.

Le Cam, L. i Yang, GL (2000). Asymptotyki w statystyce. Seria Springera w statystyce. Nowy Jork: Springer-Verlag, drugi edn.

Liao, CT i Iyer, HK (2004). Przedział tolerancji dla rozkładu normalnego z kilkoma składowymi wariancji. Statystyk. Sinica 14, 217-229.

Lindley, DV (1958). Rozkłady Fiducial i twierdzenie Bayesa. J. Roy. Statystyk. Soc. Ser. B 20, 102–107.

McNally, RJ, Iyer, HK i Mathew, T. (2003). Testy na biorównoważność indywidualną i populacyjną w oparciu o ogólne wartości p. Statystyka w medycynie 22, 31–53.

Mood, AM, Graybill, FA and Boes, DC (1974). Wprowadzenie do teorii statystyki. McGraw-Hill, trzeci edn.

Pounds, S. and Morris, SW (2003). Szacowanie występowania wyników fałszywie dodatnich i fałszywie ujemnych w badaniach mikromacierzy poprzez przybliżenie i podzielenie empirycznego rozkładu wartości p. Bioinformatics 19, 123601242.

Salome, D. (1998). Wnioskowanie gwiezdne za pomocą metod Fiducial. Doktorat praca dyplomowa, University of Groningen. 544 JAN HANNIG

Searle, SR, Casella, G. i McCulloch, CE (1992). Komponenty rozbieżności. John Wiley & Sons, Nowy Jork.

Stevens, WL (1950). Granice odniesienia parametru rozkładu nieciągłego. Biometrika 37, 117-129.

Tsui, K.-W. i Weerahandi, S. (1989). Uogólnione wartości p w testach istotności hipotez w obecności parametrów uciążliwych. J. Amer. Statystyk. Doc. 84, 602–607.

Wang, CM i Iyer, HK (2005). Propagacja niepewności w pomiarach przy użyciu wnioskowania uogólnionego. Metrologia 42, 145-153.

Wang, CM i Iyer, HK (2006a). Uogólniony przedział ufności dla wielkości mierzonej w obecności niepewności typu A i typu B. Pomiar 39, 856–863. Wang, CM i Iyer, HK (2006b). Analiza niepewności dla mierzonych wektorów z wykorzystaniem wnioskowania fiducial. Metrologia 43, 486-494.

Weerahandi, S. (1993). Uogólnione przedziały ufności. J. Amer. Statystyk. Doc. 88, 899–905.

Weerahandi, S. (2004). Uogólnione wnioskowanie w powtarzanych pomiarach. Wiley, Hoboken, NJ.

Wilkinson, GN (1977). O rozstrzygnięciu kontrowersji w wnioskowaniu statystycznym. J. Roy. Statystyk. Soc. Ser. B 39, 119–171. Z dyskusją.

Yeo, I.-K. i Johnson, RA (2001). Jednolite silne prawo dużych liczb dla statystyki U z zastosowaniem do przekształcenia w prawie symetrię. Statystyk. Probab Łotysz. 51, 63–69.

Zabell, SL (1992). RA Fisher i argument fiducial. Statystyk. Sci. 7, 369–387. Department of Statistics and Operations Research, University of North Carolina at Chapel Hill, Chapel Hill, NC 27599-3260, USA E-mail: hannig@unc.edu (otrzymano w listopadzie 2006 r .; przyjęto w grudniu 2007 r.)

Artykuł, z którego to otrzymałem, to Statistica Sinica 19 (2009), 491-544 O OGÓLNEJ INFERENCJI FIDUCIAL ∗ Jan Hannig The University of North Carolina at Chapel Hill


3
Musisz poczekać do daty ważności ...
jbowman

2
@MichaelChernick: Miałem nadzieję na wyjaśnienie argumentu i jego wad. Nie wydaje mi się, aby aktualne odpowiedzi, choć bardzo przydatne, były kompletne.
JohnRos

3
@JohnRos: Dodałem do mojej odpowiedzi, która moim zdaniem uzupełnia moją. Ogólnie uważam, że udzielenie komuś konkretnego odniesienia, które zapewni pełną odpowiedź, jest wystarczająco kompletne. Myślę, że osoba, która tak naprawdę interesuje się odpowiedzią, powinna zadać sobie trud, by spojrzeć na referencje i nauczyć się w ten sposób. Wszyscy jesteśmy dorośli i nie musimy wszystkiego karmić łyżką.
Michael R. Chernick,

1
Przewiń w dół, a zobaczysz, że @hbaghishani to ma
Makro

4
@MichaelChernick, nie sądzę, że wiele można zyskać narzekając na to, że zostałeś oceniony / nie został oceniony / nie wygrał nagrody. Jeśli tak, to prawdopodobnie zmniejszy prawdopodobieństwo, że użytkownicy zwrócą uwagę na twoje posty i zagłosują na nie w przyszłości. Jest dla mnie całkiem jasne, że włożyłeś więcej wysiłku w odpowiedź (chociaż mogłaby skorzystać z ulepszonej organizacji), ale ostatecznie wybór głosów jest kwestią opinii - prawdziwa odpowiedź brzmi prawdopodobnie „Bardziej podobała mi się odpowiedź hbaghishani”, dlaczego czy powinien to powiedzieć / wyjaśnić? Możesz również spojrzeć na powyższy komentarz JohnRos, aby uzyskać odpowiedzi.
Makro

7

Wnioskowanie Fiducial czasami interpretuje prawdopodobieństwa jako prawdopodobieństwa dla parametru . Oznacza to, że , pod warunkiem że jest skończone, jest interpretowane jako funkcja gęstości prawdopodobieństwa dla w której jest funkcją prawdopodobieństwa i . Aby zobaczyć więcej szczegółów, zobacz Casella i Berger , strony 291-2.M ( x ) L ( θ | x ) M ( x ) θ L ( θ | x ) θ M ( x ) = ( - L ( θ | x ) d θ ) - 1θM(x)L(θ|x)M(x)θL(θ|x)θM(x)=(L(θ|x)dθ)1


5

Żeby dodać do tego, co powiedziano, między Fisher a Neymanem pojawiły się kontrowersje dotyczące testowania istotności i szacowania przedziałów. Neyman zdefiniował przedziały ufności, a Fisher wprowadził przedziały odniesienia. Spierali się inaczej o swojej budowie, ale skonstruowane interwały były zwykle takie same. Tak więc różnica w definicjach była w dużej mierze ignorowana, dopóki nie odkryto, że różnią się one, gdy mają do czynienia z problemem Behrensa-Fishera. Fisher zdecydowanie opowiadał się za oceną powierniczą, ale pomimo jego nadzoru i zdecydowanego popierania tej metody, pojawiły się wady, a ponieważ społeczność statystyczna uważa, że ​​jest to zdyskredytowane, nie jest to często omawiane ani stosowane. Bayesowskie i częste podejście do wnioskowania to dwa pozostałe.


1

W dużej klasie licencjackich statystyk wprowadzających w Georgia Tech, omawiając przedziały ufności dla średniej populacji ze znaną wariancją, jeden uczeń zapytał mnie (w języku MATLAB): „Czy mogę obliczyć przedział jako> norminv ([alpha / 2,1-alfa / 2], barX, sigma / sqrt (n))? ” W tłumaczeniu: czy mógłby wziąć i kwantyle o rozkładzie normalnym wyśrodkowanym w ze skalą ? 1-αα2ˉ X σ1α2X¯σn

Powiedziałem - oczywiście TAK, mile zaskoczony, że naturalnie doszedł do koncepcji dystrybucji fiducial.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.