Jakie były główne dane statystyczne Ronalda Fishera?


13

Richard Dawkins opisał Ronalda Fishera jako „ojca nowoczesnej statystyki i eksperymentalnego projektu”, linii cytowanej w biografii Fishera w Wikipedii . A także Anders Hald nazwał go „geniuszem, który prawie samodzielnie stworzył podstawy współczesnej nauki statystycznej” w swojej książce A History of Mathematical Statistics .

Zastanawiam się tylko, co dokładnie zrobił, żeby ludzie oceniali go tak wysoko?


10
To byłby świetny post dla HSM .
Antoni Parellada,

6
@Antoni Myślę, że w pewnym momencie w przyszłości, ponieważ HSM nadal się rozwija i rozwija, HSM może stać się lepszym miejscem do zadawania pytań dotyczących historii statystycznej. Ale istnieje tak silna baza wiedzy na temat CV, z wieloma użytkownikami, którzy naprawdę interesują się aspektami historycznymi, że CV jest prawdopodobnie lepszym miejscem na teraz. (Myślę, że na dłuższą metę CV będzie prawdopodobnie nadal lepszym miejscem dla bardziej „konceptualnych” pytań historycznych.)
Silverfish

3
Nie sądzę, że potencjalnie „oparte na opiniach” to pytanie jest problemem. Zgadzam się z @AntoniParellada: Jeśli to pytanie nie należy do strony History of Science and Mathematics SE, nie jest jasne, co by to było. Jesteśmy to winni naszym kolegom z SE za migrację. Oryginalna ramka była idealnie w porządku.
Gung - Przywróć Monikę

3
Zgadzam się, „miłe pytanie”, ale może nie tutaj. Prace Fishera zostały już zebrane w dość obszerny tom Wkłady do statystyki matematycznej, które można łatwo uzyskać w każdym sklepie z używanymi książkami. Recenzja książki: jstor.org/stable/2332332 Ja osobiście nie jestem w stanie dodać lepszych słów i mogę jedynie odwoływać się do Efron jstor.org/stable/2676745 To, co rzeczywiście byłoby interesujące i dodanie informacji, jest poglądem historyków. (lub filozofów, ponieważ różne poglądy na statystyki są dość pytaniem i tak naprawdę nie rozumiem, tj. używam ich wszystkich)
Sextus Empiricus

7
@MatthewDrury Mamy stosunkowo popularny tag [history]. Pytania dotyczące historii są na naszej stronie tematyczne. Jeśli coś jest tutaj na temat, nie powinniśmy migrować IMHO, nawet jeśli jest to również na inny temat.
ameba mówi Przywróć Monikę

Odpowiedzi:


19

Bardzo trudno jest napisać odpowiedź na pytanie

Jakie były główne dane statystyczne Ronalda Fishera?

ponieważ istnieje już wiele doskonałych prac na ten temat, stworzonych przez znakomitych pisarzy, w tym wielkich statystyk, np .:

Prace te są bardzo trudne do dopasowania w kilku prostych liniach na internetowej tablicy pytań i odpowiedzi. Ponadto nie jest łatwo uchwycić całość pomysłów Fishera, jak napisał Efron w swojej pracy na temat Fishera:

Jedną z trudności w ocenie znaczenia statystyk rybackich jest to, że trudno jest po prostu powiedzieć, co to jest. Fisher miał niesamowitą liczbę ważnych pomysłów, a niektóre z nich, takie jak wnioskowanie o losowości i warunkowość, są ze sobą sprzeczne. To trochę tak, jakby w ekonomii Marks, Adam Smith i Keynes okazali się tą samą osobą.


Fisher był pionierem

Już prostym, ale bardzo dobrym źródłem wkładu Fishera jest Wikipedia. Już samo czytanie artykułu na temat historii statystyk (lub możesz użyć dowolnego innego tekstu) da ci pewien wgląd w ilość i znaczenie wkładów Fishera.

Przekonasz się również, że to częściowo czas, lokalizacja i szczęście sprawiły, że Fisher był świetnym współpracownikiem. Fisher był ważnym i wpływowym statystykiem na początku XX wieku, kiedy stworzono podstawowe podstawy statystyki stosowanej, a dziedzina była stosunkowo niewielka (porównywalna z matematyką z okresu XVIII i XIX wieku).

Pierwszy dziennik statystyk i pierwszy wydział statystyczny na uniwersytecie został właśnie uruchomiony, gdy Fisher wszedł na scenę. Przed początkiem XX wieku istniały głównie metody regresji i kilka pomysłów na temat rozkładu resztkowych terminów i błędów, stosowanych w takich dziedzinach jak astronomia.

Pojęcia błędów pomiaru i prawdopodobieństwa wyników. Ten rodzaj matematyki i logiki (bardziej zbliżony do czystej matematyki i ... postrzegany jako bardziej szlachetny i mniej potępiany przez poważnych matematyków tamtych czasów), został szerzej zastosowany w dziedzinach wybranych przez Fishera: genetyka, ewolucja, biologia, rolnictwo . Ponieważ Fisher, znakomity matematyk, wniósł znaczący wkład w te wczesne zmiany (lub nawet może być uważany za główny motor tych zmian), jego praca została umieszczona na ważnym miejscu w historii statystyki.

Podstawowe pojęcia i narzędzia

Jeśli spojrzysz na tematy w książce wprowadzającej na temat statystyki (w szczególności pojęć matematycznych lub wnioskowania), możesz uznać Fishera za dominującego autora. Również Fisher napisał pierwsze i najbardziej wpływowe wprowadzenie do książek statystycznych :

  • Metody statystyczne dla pracowników naukowych (1925)
  • The Design of Experiments (1935) (wykorzystanie eksperymentu z filiżanką herbaty do wyjaśnienia między innymi randomizacji, użycia kwadratów łacińskich, hipotezy zerowej, znaczenia, wrażliwości / mocy i zasadniczo wszystkiego; Yates stanowi historyczne tło tej pracy)

Należy pamiętać, że wersje online tych książek istnieją SMRW i częściowo DE (patrz czytania 29 października b) .

W latach 1912–1925 Fisher:

  • pomógł poprawić test chi-kwadrat (gdzie Pearson i inni mylili się co do liczby stopni swobody przez wiele lat),
  • dostarczył dokładny test, aby obliczyć wartość p dla dobroci dopasowania przy niskiej liczbie obserwacji (która została nazwana jego imieniem jako dokładny test Fishera ),
  • napisał dowód (jako licencjata) na „rozkład studenta” Gosseta (i rozwinął go podczas swojej pracy nad małymi liczbami obserwacyjnymi , takimi jak pomysły wykorzystania stopni swobody zamiast wielkości próbki podczas korzystania ze statystyk próbek) ( patrz historyczny opis córki Fishera Joan Fisher Box ),N1N
  • opracował analizę wariancji i rozkładu F (również nazwanego jego imieniem), oraz
  • (inną „małą” rzeczą, którą zrobił jako student) było opracowanie podstaw i koncepcji maksymalnego prawdopodobieństwa ( RA Fisher Aldricha i Making of Maximum Likelihood ).

Z grubsza obejmuje to większość podstawowych narzędzi wnioskowania, z których korzystają obecne teksty wprowadzające. Podczas pracy nad statystykami Fisher zajął się poważnymi problemami genetycznymi, które sprawiają, że ludzie tacy jak Richard Dawkins tak go podziwiają.

Terminologia

Fisher wprowadził wiele pojęć i terminów oraz ulepszył język statystyczny. Dwa ostatnie pytania na tej stronie pytań i odpowiedzi dotyczą Fishera. Pytanie, dlaczego tak wiele zmiennych jest kwadratowych w statystykach i dlaczego tak często normę zamiastL2L1 . To Fisher „udowodnił”, że norma jest lepszym (bardziej wydajnym) estymatorem niż norma (zakładając idealny rozkład Gaussa, który Fisher zgodził się później nie zawsze jest prawdziwy dla „prawdziwych” błędów), i wprowadził wyprowadzone terminy jest to jednocześnie „skuteczna statystyka” i „wystarczająca statystyka” , a także wprowadzenie terminu „wariancja”L2L1(w swojej pracy z 1920 r . Matematyczna obserwacja metod określania dokładności obserwacji na podstawie błędu średniego i średniego błędu kwadratowego ).

Podwaliny

W artykule z 1922 r. Na temat matematycznych podstaw statystyki teoretycznej Fisher przedstawia krótki i prosty przegląd głównych pojęć, aby wymienić tylko listę definicji: „centrum lokalizacji”, „spójność”, „dystrybucja”, „wydajność”, „ oszacowanie ”,„ dokładność wewnętrzna ”,„ regiony izostatystyczne ”,„ prawdopodobieństwo ”,„ lokalizacja ”,„ optymalne ”,„ skalowanie ”,„ specyfikacja ”,„ wystarczalność ”,„ ważność ” . Wymaga to od historyka zobaczenia, co wniósł tu Fisher w sensie bycia pomysłodawcą pojęć, a to także odnosi się do wypowiedzi Efrona. Trudno pojąć, co dokładnie jest przez kogo.

W tym artykule Fisher zaczyna wspominać o problemie stosowania terminów takich jak „średnia” i „wariancja” zarówno do prawdziwej wartości rozkładu, jak i wartości szacunkowej.

(Postaram się unikać umieszczania Fishera gdzieś w „szkole”, takiej jak częsty czy Bayesian. Powiedziałbym, że był on „wystarczająco” praktyczny, aby odpowiedzieć na każde pytanie, które było pod ręką).

Zaawansowane koncepcje

W swojej dalszej pracy Fisher opracował wczesne koncepcje liniowej analizy dyskryminacyjnej :

jaka funkcja liniowa czterech pomiarów zmaksymalizuje stosunek różnicy między konkretnymi średnimi do standardowych odchyleń w obrębie gatunku?X=λ1x1+λ2x2+λ3x3+λ4x4

Zastosowanie wielu pomiarów w problemach taksonomicznych, 1936

oraz pojęcie szacowania według prawdopodobieństwa, które Fisher zbadał dalej, i ma dwa pojęcia nazwane jego imieniem, informacje Fishera i wynik Fishera . Patrz Teoria estymacji statystycznej, 1925 , Dwie nowe właściwości prawdopodobieństwa matematycznego, 1934 i Logika wnioskowania indukcyjnego, 1935 .

Więcej linków:

  • RA Fisher Guide , John Aldrich. Ogromne źródło, jeśli nie największe, z informacjami na temat Fishera, z wieloma dalszymi referencjami.
  • Odpowiedź Michaela Hardy'ego na Mathoverflow na pytanie o największych matematyków: /mathpro//a/173374

Napisane przez StackExchangeStrike


Dziękuję @Martijn! Przejrzałem twoją odpowiedź i wprowadziłem małe poprawki tu i tam, głównie po to, aby formatowanie było jaśniejsze i aby poprawić literówki. Mam nadzieję, że nie będziesz miał nic przeciwko. Z przyjemnością przyznam nagrodę za tę odpowiedź; bardzo dobry wkład. Szczególnie dobrze jest mieć wszystkie te referencje.
ameba mówi Przywróć Monikę

Wcale nie, świetne zmiany, dlatego stworzyłem wiki społeczności. To jest wielkie pytanie, na które należy odpowiedzieć. Chociaż jestem wielkim fanem Fishera i przejrzałem kilka jego artykułów, czułem, że nie powinienem był odpowiadać na (załadowane) pytanie.
Sextus Empiricus

Reklamowałem twoją odpowiedź na naszym czacie i teraz widzę, że stała się ona najbardziej popularną w tym wątku. Myślę, że to zasłużone.
ameba mówi Przywróć Monikę

8

Wymyślił kilka pojęć: wystarczalność, wydajność, ANOVA, filarność, wartość p i prawdopodobnie wiele innych (najważniejsze projektowanie eksperymentów).

Funkcja prawdopodobieństwa i mle miała prekursorów, ale został przez niego spopularyzowany.


9
+1 Podczas gdy Fisher z pewnością powinien uzyskać w tym względzie uznanie, wydaje się, że koncepcja wartości p istniała, przynajmniej nieformalnie, przed pracą FIshera. Pearson wyraźnie oblicza wartości pw swoim artykule z 1900 r. Na temat testu dopasowania chi-kwadrat i traktuje to, co oblicza (choćby opisywane tylko mimochodem), jakby to było oczywiste, zaakceptowane zadanie. Odnosi się wrażenie, że nie była postrzegana jako nowa koncepcja wprowadzona w tym artykule. Oczywiście podobne rzeczy można powiedzieć o wielu pojęciach ... często są „przez jakiś czas”, zanim ktoś je sformalizuje.
Glen_b

8

Sir Ronald Aylmer Fisher jest uznawany za wiele aspektów projektowania eksperymentalnego oraz nowoczesnej teorii i praktyki statystycznej. Niektóre z jego najważniejszych prac obejmują testowanie istotności (Bandyopadhyay i Cherry 2011), szacowanie maksymalnego prawdopodobieństwa (MLE), rozkłady permutacji (ponowne próbkowanie), wystarczalność, teorię optymalności asymptotycznej (Efron 1998) oraz eksperymentalne elementy projektu, w tym randomizację, replikację, blokowanie, dezorientacja i analiza wariancji (ANOVA). Na uwagę zasługuje również jego twierdzenie dotyczące eksperymentu Mendla w Pea Plant. Twierdził, że „było zbyt piękne, aby mogło być prawdziwe”.

Zastanów się nad przeczytaniem tego artykułu Efrona (1998) „RA Fisher w 21 wieku”. Pozwól mi zacytować streszczenie:

Fisher jest najważniejszą postacią w statystykach XX wieku. W tym wykładzie analizuje się jego wpływ na współczesne myślenie statystyczne, próbując przewidzieć, jaki Fisherian możemy oczekiwać w XXI wieku. Filozofia Fishera charakteryzuje się szeregiem sprytnych kompromisów między poglądami bayesowskimi a częstokroć, wzbogaconymi o pewne unikalne cechy, które są szczególnie przydatne w zastosowanych problemach. Kilka aktualnych tematów badawczych jest badanych pod kątem wpływu rybactwa lub jego braku, a także tego, co to oznacza dla przyszłych zmian statystycznych. Na podstawie wykładu Fishera z 1996 r. Artykuł ściśle śledzi tekst tego przemówienia.

Bibliografia

  • Bandyopadhyay, Prasanta S. i Steve Cherry. „Elementarne prawdopodobieństwo i statystyka: elementarz”. Filozofia statystyki 7 (2011): 53.

  • Efron, Bradley. „ RA Fisher w XXI wieku ”. Statistics Science (1998): 95-114.


1
Jego wersja testu istotności była wnioskiem, który był kontrowersyjny i nie zaakceptował tego, jak była teoria Neymana-Pearsona. Inne wkłady były monumentalne i stanowiły część podstaw statystyki.
Michael R. Chernick

3
Wydaje się, że wnioskowanie fiducial znajduje teraz niektórych fanów. Zauważam, że nikt jeszcze nie wspomniał o Fisher Information ani użytecznych wytycznych, takich jak „Analizujesz losowo”.
Björn,

Bjorn - tak, zdecydowanie przegapiłem część Informacje o Fisherze. Prawdopodobnie dlatego, że skopiowałem ten tekst z artykułu, który piszę na temat informacji: fisher. Ha!
Jessica Burnett,
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.