Czy powinienem najpierw uczyć statystyki bayesowskiej czy częstokrzyskiej?


32

Pomagam moim chłopcom, obecnie w szkole średniej, w zrozumieniu statystyk i zastanawiam się nad kilkoma prostymi przykładami, nie zapominając o przebłyskach teorii.

Moim celem byłoby zaproponowanie im najbardziej intuicyjnego, ale instrumentalnie konstruktywnego podejścia do nauki statystyk od zera, aby wzbudzić ich zainteresowanie dalszą nauką statystyki i nauką ilościową.

Zanim jednak zacznę, mam szczególne pytanie o bardzo ogólnych implikacjach:

Czy powinniśmy zacząć uczyć statystyki z wykorzystaniem bayesowskich czy częstych ram?

Rozglądając się wokół, zauważyłem, że wspólne podejście zaczyna się od krótkiego wprowadzenia do statystyki częstych, a następnie dogłębnej dyskusji na temat statystyki bayesowskiej (np. Stangl ).


5
Na twoje pytanie trudno odpowiedzieć bez większego kontekstu. Co chciałbyś osiągnąć?
Glen_b

4
Nauczanie dzieci bayesowskich statystyk, takie jak nalewanie im wódki lub zapalanie cygar, jest złe. Zwróć uwagę, że zarówno wódka, jak i cygara są odpowiednie dla dorosłych, o ile odkrywają je na własną rękę
Aksakal

2
@Aksakal Właściwie planowałem nauczyć ich twierdzenia Bayesa, popijając wódkę i dmuchając havanas; ;-)
Joe_74,

2
To dobry sposób na powstrzymanie dzieciaka od statystyk bayesowskich przez kilka lat. Mówisz im, że to tylko zastosowania twierdzenia Bayesa. Twierdzenie to działa dobrze w statystykach częstych
Aksakal

5
Książka Nate'a Silvera „Sygnał i hałas” przemawia za nauczaniem młodych ludzi statystyki bayesowskiej.
Lloyd Christmas,

Odpowiedzi:


25

Zarówno statystyki bayesowskie, jak i częste są oparte na teorii prawdopodobieństwa, ale powiedziałbym, że ta pierwsza opiera się na teorii od samego początku. Z drugiej strony, koncepcja wiarygodnego przedziału jest z pewnością bardziej intuicyjna niż przedział ufności, gdy student dobrze rozumie pojęcie prawdopodobieństwa. Tak więc, cokolwiek wybierzesz, zalecam przede wszystkim wzmocnienie ich koncepcji prawdopodobieństwa, przy użyciu wszystkich przykładów opartych na kościach, kartach, ruletce, paradoksie Monty Hall itp.

Wybrałbym jedno lub drugie podejście oparte na czysto utylitarnym podejściu: czy są bardziej skłonni do studiowania statystyki częstokrzyskiej lub bayesowskiej w szkole? W moim kraju na pewno nauczyliby się najpierw ram dla osób często uczęszczających do szkoły (i na koniec: nigdy nie słyszałem o uczniach liceum nauczanych statystyk bayesowskich, jedyną szansą jest albo na uniwersytecie, albo później, przez samokształcenie). Może u ciebie jest inaczej. Należy pamiętać, że jeśli muszą poradzić sobie z NHST (test zerowego znaczenia hipotezy), bardziej naturalnie powstaje to w kontekście statystyk częstych, IMO. Oczywiście można testować hipotezy również w ramach bayesowskich, ale istnieje wielu wiodących statystów bayesowskich, którzy opowiadają się za tym, aby w ogóle nie stosować NHST, zarówno w ramach częstych, jak i bayesowskich (na przykład Andrew Gelman z Columbia University).

Wreszcie, nie wiem o poziomie uczniów szkół średnich w twoim kraju, ale w moim przypadku bardzo trudno byłoby studentowi z powodzeniem przyswoić (podstawy) teorii prawdopodobieństwa i rachunku całkowego. Tak więc, jeśli zdecydujesz się na statystyki bayesowskie, naprawdę unikałbym ciągłego przypadku zmiennych losowych i trzymałem się dyskretnych zmiennych losowych.


2
Miałem wrażenie (po przeczytaniu jego bloga), że Andrew Gelman opowiedziałby się przeciwko częstemu NSHT tak samo jak przeciwko Bayesianowi.
psarka

2
@psarka tak, jasne - nigdy nie powiedziałem inaczej.
DeltaIV

3
„W moim kraju na pewno najpierw nauczyliby się frameworku” - To (lub całkowite pominięcie dyskusji o bayesianizmie) jest tradycyjnym podejściem na całym świecie.
Kodiolog,

1
@Kodiologist Podejrzewałem tak samo. Przynajmniej mogą istnieć niektóre systemy edukacyjne, w których po systemie częstokrzyskim wprowadzono również system bayesowski w szkole średniej. Ale tutaj tak nie jest.
DeltaIV

22

Bayesian i częsty zadają różne pytania. Bayesian pyta, jakie wartości parametrów są wiarygodne, biorąc pod uwagę zaobserwowane dane. Frequentist pyta o prawdopodobieństwo wyimaginowanych danych symulowanych, jeśli niektóre hipotetyczne wartości parametrów byłyby prawdziwe. Decyzje częstych są motywowane przez kontrolowanie błędów, decyzje bayesowskie są motywowane niepewnością w opisach modeli.

Więc czego powinieneś uczyć najpierw? Cóż, jeśli jedno z tych pytań jest tym, co chcesz zadać jako pierwsze, to twoja odpowiedź. Ale pod względem przystępności i pedagogiki uważam, że Bayesian jest znacznie łatwiejszy do zrozumienia i jest o wiele bardziej intuicyjny. Podstawową ideą analizy bayesowskiej jest ponowny przydział wiarygodności między możliwościami, tak jak to słynie powiedział Sherlock Holmes, i który miliony czytelników intuicyjnie zrozumieli. Ale podstawowa idea analizy częstokroćowej jest bardzo trudna: przestrzeń wszystkich możliwych zestawów danych, które mogłyby się wydarzyć, gdyby konkretna hipoteza była prawdziwa, oraz odsetek tych urojonych zestawów danych, których statystyka podsumowująca jest równa lub bardziej ekstremalna niż podsumowanie statystyki, które faktycznie zaobserwowano.

Darmowy rozdział wprowadzający na temat idei bayesowskich tutaj . Artykuł, który ustawia obok siebie pojęcia częste i bayesowskie, znajduje się tutaj . Artykuł wyjaśnia częste i bayesowskie podejście do testowania hipotez i szacowania (i wielu innych rzeczy). Ramy tego artykułu mogą być szczególnie przydatne dla początkujących próbujących uzyskać widok na krajobraz.


Dołączenie tytułów rozdziału i artykułu może być pomocne na wypadek, gdyby linki zniknęły w przyszłości.
Richard Hardy,

8

To pytanie może być oparte na opiniach, więc postaram się być bardzo zwięzły z moją opinią, a następnie dam ci sugestię książki. Czasami warto zastosować określone podejście, ponieważ jest to podejście, które przyjmuje szczególnie dobra książka.

Zgodziłbym się, że statystyki bayesowskie są bardziej intuicyjne. Różnica między przedziałem ufności a przedziałem wiarygodności w dużym stopniu podsumowuje: ludzie naturalnie myślą w kategoriach „jaka jest szansa, że ​​...”, a nie w podejściu przedziału ufności. Podejście z przedziałem ufności brzmi tak, jakby mówiło to samo co z przedziałem wiarygodności, z wyjątkiem ogólnej zasady, że nie można zrobić ostatniego kroku od „95% czasu” do „95% szansy”, co wydaje się bardzo częste, ale ty nie mogę tego zrobić. To nie jest niekonsekwentne, tylko intuicyjne.

Równoważenie tego polega na tym, że większość kursów uniwersyteckich, które wybiorą, będzie wykorzystywała mniej intuicyjne podejście do częstych.

To powiedziawszy, bardzo podoba mi się książka „ Refleksja statystyczna: kurs bayesowski z przykładami w R i Stan” autorstwa Richarda McElreath. To nie jest tanie, więc przed zakupem przeczytaj o nim i pogrzebaj w nim. Uważam to za szczególnie intuicyjne podejście, które wykorzystuje podejście bayesowskie i jest bardzo praktyczne. (A ponieważ R i Stan są doskonałymi narzędziami do statystyki bayesowskiej i są bezpłatne, jest to praktyczna nauka.)

EDYCJA: Kilka komentarzy wspomniało, że książka prawdopodobnie wykracza poza liceum, nawet z doświadczonym nauczycielem . Muszę więc postawić jeszcze większe zastrzeżenie: na początku ma proste podejście, ale szybko się rozwija. To niesamowita książka, ale naprawdę musiałbyś ją przejrzeć na Amazonce, aby poznać jej początkowe założenia i jak szybko się rozwija. Piękne analogie, świetna praktyczna praca w R, niesamowity przepływ i organizacja, ale być może nie są dla ciebie przydatne.

Zakłada podstawową wiedzę na temat programowania i R (darmowy pakiet statystyczny) oraz pewną ekspozycję na podstawy prawdopodobieństwa i statystyki. Dostęp nie jest przypadkowy, a każdy rozdział opiera się na poprzednich rozdziałach. Zaczyna się bardzo prosto, choć trudność rośnie w środku - kończy się na regresji wielopoziomowej. Możesz więc przejrzeć niektóre z nich w Amazon i zdecydować, czy możesz z łatwością omówić podstawy, czy też przeskoczy nieco za daleko.

EDYCJA 2: Sedno mojego wkładu tutaj i próba odwrócenia go od czystej opinii jest taka, że ​​dobry podręcznik może zadecydować, jakie podejmiecie podejście. Wolę podejście bayesowskie, a ta książka robi to dobrze, ale być może w zbyt szybkim tempie.


2
Książka McElreath jest doskonała, ale byłbym naprawdę zaskoczony, gdyby uczniowie szkół średnich byli w stanie podążać za takim poziomem leczenia, nawet z utalentowanym nauczycielem.
DeltaIV

2
@DeltaIV: Dobra opinia, zredaguję swoją odpowiedź. Kilka razy mnie oszukało, jak na początku jest czytelne i analogiczne. Wchodzi w stromą krzywą uczenia się mniej więcej w połowie, i prawdopodobnie dużo wcześniej.
Wayne,

1
Kolejna uwaga: myślę, że istnieje większa przepaść między podstawami (tj. Teorią prawdopodobieństwa) a stosowaniem metod Frequentist nad metodami bayesowskimi. Oznacza to, że mam problem z wyobrażeniem sobie, że ktoś naprawdę rozumie teorię MLE, dowód CLT itp. Bez wykształcenia wyższego, wymaganego nawet w przypadku najbardziej podstawowych procedur Frequentist. Kiedy poznasz prawdopodobieństwo warunkowe, w zasadzie rozumiesz, jak działa wnioskowanie bayesowskie. Teoria MCMC jest nieco trudna, ale szczerze mówiąc o wiele prostsza niż prawdziwe zrozumienie teorii MLE ...
Cliff AB

... a ponieważ łatwiej jest wypełnić lukę między prawdopodobieństwem a zastosowaniem statystyk w ramach Bayesa, przynajmniej myślę, że dzięki temu sprawy stają się bardziej satysfakcjonujące psychicznie. Nienawidziłam uczęszczania na kursy, na których musieliśmy powiedzieć „i zaufaj nam, teoria MLE działa z dużymi próbkami”, ponieważ czułem, że musiało to nieco zabić czyjąś naukową ciekawość lub wymagać znacznie większego zaangażowania umysłowego.
Cliff AB,

... Ale intuicja kryjąca się
kjetil b halvorsen

5

Najpierw nauczono mnie podejścia częstokroć, a potem bayesowskiego. Nie jestem zawodowym statystykiem.

Muszę przyznać, że moja wcześniejsza wiedza na temat częstościowego podejścia nie była zdecydowanie przydatna w zrozumieniu podejścia bayesowskiego.

Odważę się powiedzieć, że zależy to od tego, jakie konkretne wnioski pokażesz swoim uczniom, a także ile czasu i wysiłku poświęcisz im.

Powiedziawszy to, zacznę od Bayesa.


3

Struktura bayesowska jest ściśle powiązana z ogólnymi umiejętnościami krytycznego myślenia. Tego potrzebujesz w następujących sytuacjach:

  1. Myślisz o ubieganiu się o konkurencyjną pracę. Jakie masz szanse na wejście? Jakiej wypłaty oczekujesz od złożenia wniosku?
  2. Nagłówek mówi, że telefony komórkowe powodują raka u ludzi w dłuższej perspektywie. Ile mają na to dowodów?
  3. Na którą organizację charytatywną powinieneś przekazać pieniądze, jeśli chcesz, aby przyniosło to jak największy efekt?
  4. Ktoś oferuje rzut monetą z zakładem 0,90 $ od ciebie i 1,10 $ od nich. Dasz im pieniądze? Dlaczego? Dlaczego nie?
  5. Zgubiłeś klucze (lub bombę atomową). Gdzie zaczynasz szukać?

Jest to również o wiele bardziej interesujące niż zapamiętywanie wzoru na test dwóch t: p. Zwiększa to szansę, że uczniowie będą zainteresowani wystarczająco długo, aby zawracać sobie głowę coraz bardziej technicznym materiałem.


3

Nikt nie wspomniał o prawdopodobieństwie, które jest fundamentem statystyki bayesowskiej. Argumentem przemawiającym za nauczaniem Bayesa w pierwszej kolejności jest to, że przepływ od prawdopodobieństwa do prawdopodobieństwa do Bayesa jest dość płynny. Bayesa można motywować z prawdopodobieństwa, zauważając, że (i) funkcja prawdopodobieństwa wygląda (i działa) jak funkcja rozkładu prawdopodobieństwa, ale nie dzieje się tak, ponieważ pole pod krzywą nie wynosi 1,0, oraz (ii) surowy, powszechnie używany Wald interwały przyjmują funkcję prawdopodobieństwa, która jest proporcjonalna do rozkładu normalnego, ale metody bayesowskie łatwo pokonują to ograniczenie.

Kolejnym argumentem przemawiającym na korzyść Bayesa po pierwsze jest to, że obawy P (A | B) w porównaniu z P (B | A) dotyczące wartości p można łatwiej wyjaśnić, jak wspomniali inni.

Kolejnym argumentem przemawiającym za „Bayesem pierwszym” jest to, że zmusza studentów do dokładniejszego zastanowienia się nad modelami prawdopodobieństwa warunkowego, które są przydatne w innych miejscach, np. W analizie regresji.

Przepraszam za autopromocję, ale ponieważ jest ona całkowicie tematyczna, nie mam nic przeciwko stwierdzeniu, że właśnie takie podejście przyjęliśmy z Keven Henning w naszej książce „Zrozumienie zaawansowanych metod statystycznych” ( https: // peterwestfall. wixsite.com/book-1 ), których docelowymi odbiorcami są osoby niebędące statystykami.


2

Czy uczysz dla zabawy i wglądu, czy do praktycznego zastosowania? Jeśli chodzi o nauczanie i zrozumienie, wybrałbym Bayesa. Jeśli ze względów praktycznych zdecydowanie wybrałbym Częstochowcę.

W wielu dziedzinach - i przypuszczam, że w większości dziedzin - nauk przyrodniczych, ludzie są przyzwyczajeni do publikowania swoich artykułów o wartości p. Twoi „chłopcy” będą musieli przeczytać papiery innych ludzi, zanim zaczną pisać własne. Aby czytać prace innych ludzi, przynajmniej w mojej dziedzinie, muszą zrozumieć hipotezę zerową i wartości p, bez względu na to, jak głupi mogą się wydawać po studiach bayesowskich. I nawet kiedy będą gotowi opublikować swój pierwszy artykuł, prawdopodobnie będą mieli jakiegoś starszego naukowca kierującego zespołem i są szanse, wolą częstotliwość.

Biorąc to pod uwagę, chciałbym się zgodzić z @Wayne, ponieważ ponowne przemyślenie statystyki pokazuje bardzo wyraźną drogę do statystyki bayesowskiej jako pierwszego podejścia i nie opiera się na istniejącej wiedzy na temat częstotliwości. To wspaniałe, że ta książka nie próbuje cię przekonać w walce o lepsze lub gorsze statystyki. Argumentem autora dla Bayesa jest (IIRC), że nauczał on obu rodzajów, a Bayes był łatwiejszy do nauczenia.


2

Trzymałbym się z dala od Bayesian, podążałem za gigantami.

Sowieci mieli doskonałą serię książek dla uczniów szkół średnich, z grubsza przetłumaczoną na angielski jako „małą bibliotekę”. Kołmogorow napisał książkę ze współautorami zatytułowaną „Wprowadzenie do teorii prawdopodobieństwa”. Nie jestem pewien, czy kiedykolwiek został przetłumaczony na angielski, ale oto link do jego rosyjskiego oryginału.

Podchodzą do wyjaśniania prawdopodobieństwa za pomocą kombinatoryki, co moim zdaniem jest świetnym sposobem na rozpoczęcie. Książka jest bardzo dostępna dla ucznia liceum z przyzwoitą matematyką. Zauważ, że Sowieci nauczali matematyki dość szeroko, więc przeciętni zachodni licealiści mogą nie być tak dobrze przygotowani, ale z wystarczającym zainteresowaniem i siłą woli mogą nadal radzić sobie z treścią.

Treść jest bardzo interesująca dla studentów, ma losowe spacery, ograniczające rozkłady, procesy przetrwania, prawo wielkich liczb itp. Jeśli połączysz to podejście z symulacjami komputerowymi, stanie się to jeszcze bardziej zabawne.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.