Bardzo trudno jest napisać odpowiedź na pytanie
Jakie były główne dane statystyczne Ronalda Fishera?
ponieważ istnieje już wiele doskonałych prac na ten temat, stworzonych przez znakomitych pisarzy, w tym wielkich statystyk, np .:
- Hotelling, 1951, Wpływ RA Fishera na statystyki
- Savage, 1976, On Rereading RA Fisher
- Yates, 1964, Sir Ronald Fisher i Design of Experiments
- Yates, 1962, Sir Ronald Aylmer Fisher (1890 - 1962)
- Pearce, 1979, Projekt eksperymentalny: RA Fisher i Some Modern Rivals
- Efron, 1998, RA Fisher w 21 wieku
Prace te są bardzo trudne do dopasowania w kilku prostych liniach na internetowej tablicy pytań i odpowiedzi. Ponadto nie jest łatwo uchwycić całość pomysłów Fishera, jak napisał Efron w swojej pracy na temat Fishera:
Jedną z trudności w ocenie znaczenia statystyk rybackich jest to, że trudno jest po prostu powiedzieć, co to jest. Fisher miał niesamowitą liczbę ważnych pomysłów, a niektóre z nich, takie jak wnioskowanie o losowości i warunkowość, są ze sobą sprzeczne. To trochę tak, jakby w ekonomii Marks, Adam Smith i Keynes okazali się tą samą osobą.
Fisher był pionierem
Już prostym, ale bardzo dobrym źródłem wkładu Fishera jest Wikipedia. Już samo czytanie artykułu na temat historii statystyk (lub możesz użyć dowolnego innego tekstu) da ci pewien wgląd w ilość i znaczenie wkładów Fishera.
Przekonasz się również, że to częściowo czas, lokalizacja i szczęście sprawiły, że Fisher był świetnym współpracownikiem. Fisher był ważnym i wpływowym statystykiem na początku XX wieku, kiedy stworzono podstawowe podstawy statystyki stosowanej, a dziedzina była stosunkowo niewielka (porównywalna z matematyką z okresu XVIII i XIX wieku).
Pierwszy dziennik statystyk i pierwszy wydział statystyczny na uniwersytecie został właśnie uruchomiony, gdy Fisher wszedł na scenę. Przed początkiem XX wieku istniały głównie metody regresji i kilka pomysłów na temat rozkładu resztkowych terminów i błędów, stosowanych w takich dziedzinach jak astronomia.
Pojęcia błędów pomiaru i prawdopodobieństwa wyników. Ten rodzaj matematyki i logiki (bardziej zbliżony do czystej matematyki i ... postrzegany jako bardziej szlachetny i mniej potępiany przez poważnych matematyków tamtych czasów), został szerzej zastosowany w dziedzinach wybranych przez Fishera: genetyka, ewolucja, biologia, rolnictwo . Ponieważ Fisher, znakomity matematyk, wniósł znaczący wkład w te wczesne zmiany (lub nawet może być uważany za główny motor tych zmian), jego praca została umieszczona na ważnym miejscu w historii statystyki.
Podstawowe pojęcia i narzędzia
Jeśli spojrzysz na tematy w książce wprowadzającej na temat statystyki (w szczególności pojęć matematycznych lub wnioskowania), możesz uznać Fishera za dominującego autora. Również Fisher napisał pierwsze i najbardziej wpływowe wprowadzenie do książek statystycznych :
- Metody statystyczne dla pracowników naukowych (1925)
- The Design of Experiments (1935) (wykorzystanie eksperymentu z filiżanką herbaty do wyjaśnienia między innymi randomizacji, użycia kwadratów łacińskich, hipotezy zerowej, znaczenia, wrażliwości / mocy i zasadniczo wszystkiego; Yates stanowi historyczne tło tej pracy)
Należy pamiętać, że wersje online tych książek istnieją SMRW i częściowo DE (patrz czytania 29 października b) .
W latach 1912–1925 Fisher:
- pomógł poprawić test chi-kwadrat (gdzie Pearson i inni mylili się co do liczby stopni swobody przez wiele lat),
- dostarczył dokładny test, aby obliczyć wartość p dla dobroci dopasowania przy niskiej liczbie obserwacji (która została nazwana jego imieniem jako dokładny test Fishera ),
- napisał dowód (jako licencjata) na „rozkład studenta” Gosseta (i rozwinął go podczas swojej pracy nad małymi liczbami obserwacyjnymi , takimi jak pomysły wykorzystania stopni swobody zamiast wielkości próbki podczas korzystania ze statystyk próbek) ( patrz historyczny opis córki Fishera Joan Fisher Box ),N.- 1N.
- opracował analizę wariancji i rozkładu F (również nazwanego jego imieniem), oraz
- (inną „małą” rzeczą, którą zrobił jako student) było opracowanie podstaw i koncepcji maksymalnego prawdopodobieństwa ( RA Fisher Aldricha i Making of Maximum Likelihood ).
Z grubsza obejmuje to większość podstawowych narzędzi wnioskowania, z których korzystają obecne teksty wprowadzające. Podczas pracy nad statystykami Fisher zajął się poważnymi problemami genetycznymi, które sprawiają, że ludzie tacy jak Richard Dawkins tak go podziwiają.
Terminologia
Fisher wprowadził wiele pojęć i terminów oraz ulepszył język statystyczny. Dwa ostatnie pytania na tej stronie pytań i odpowiedzi dotyczą Fishera. Pytanie, dlaczego tak wiele zmiennych jest kwadratowych w statystykach i dlaczego tak często normę zamiastL.2)L.1 . To Fisher „udowodnił”, że norma jest lepszym (bardziej wydajnym) estymatorem niż norma (zakładając idealny rozkład Gaussa, który Fisher zgodził się później nie zawsze jest prawdziwy dla „prawdziwych” błędów), i wprowadził wyprowadzone terminy jest to jednocześnie „skuteczna statystyka” i „wystarczająca statystyka” , a także wprowadzenie terminu „wariancja”L.2)L.1(w swojej pracy z 1920 r . Matematyczna obserwacja metod określania dokładności obserwacji na podstawie błędu średniego i średniego błędu kwadratowego ).
Podwaliny
W artykule z 1922 r. Na temat matematycznych podstaw statystyki teoretycznej Fisher przedstawia krótki i prosty przegląd głównych pojęć, aby wymienić tylko listę definicji: „centrum lokalizacji”, „spójność”, „dystrybucja”, „wydajność”, „ oszacowanie ”,„ dokładność wewnętrzna ”,„ regiony izostatystyczne ”,„ prawdopodobieństwo ”,„ lokalizacja ”,„ optymalne ”,„ skalowanie ”,„ specyfikacja ”,„ wystarczalność ”,„ ważność ” . Wymaga to od historyka zobaczenia, co wniósł tu Fisher w sensie bycia pomysłodawcą pojęć, a to także odnosi się do wypowiedzi Efrona. Trudno pojąć, co dokładnie jest przez kogo.
W tym artykule Fisher zaczyna wspominać o problemie stosowania terminów takich jak „średnia” i „wariancja” zarówno do prawdziwej wartości rozkładu, jak i wartości szacunkowej.
(Postaram się unikać umieszczania Fishera gdzieś w „szkole”, takiej jak częsty czy Bayesian. Powiedziałbym, że był on „wystarczająco” praktyczny, aby odpowiedzieć na każde pytanie, które było pod ręką).
Zaawansowane koncepcje
W swojej dalszej pracy Fisher opracował wczesne koncepcje liniowej analizy dyskryminacyjnej :
jaka funkcja liniowa czterech pomiarów zmaksymalizuje stosunek różnicy między konkretnymi średnimi do standardowych odchyleń w obrębie gatunku?X= λ1x1+ λ2)x2)+ λ3)x3)+ λ4x4
Zastosowanie wielu pomiarów w problemach taksonomicznych, 1936
oraz pojęcie szacowania według prawdopodobieństwa, które Fisher zbadał dalej, i ma dwa pojęcia nazwane jego imieniem, informacje Fishera i wynik Fishera . Patrz Teoria estymacji statystycznej, 1925 , Dwie nowe właściwości prawdopodobieństwa matematycznego, 1934 i Logika wnioskowania indukcyjnego, 1935 .
Więcej linków:
- RA Fisher Guide , John Aldrich. Ogromne źródło, jeśli nie największe, z informacjami na temat Fishera, z wieloma dalszymi referencjami.
- Odpowiedź Michaela Hardy'ego na Mathoverflow na pytanie o największych matematyków: /mathpro//a/173374
Napisane przez StackExchangeStrike