Jakie jest wytłumaczenie twojego ulubionego laika dla trudnej koncepcji statystycznej?


36

Naprawdę lubię słyszeć proste wyjaśnienia złożonych problemów. Jaka jest twoja ulubiona analogia lub anegdota, która wyjaśnia trudną koncepcję statystyczną?

Moim ulubionym jest wyjaśnienie Murraya dotyczące kointegracji za pomocą pijaka i jej psa. Murray wyjaśnia, w jaki sposób dwa przypadkowe procesy (wędrujący pijany i jej pies, Oliver) mogą mieć korzenie jednostkowe, ale nadal mogą być powiązane (zintegrowane), ponieważ ich pierwsze wspólne różnice są nieruchome.

Pijani wyruszają z baru, błąkając się bez celu w sposób losowy. Ale okresowo intonuje „Oliver, gdzie jesteś?”, A Oliver przerywa jego bezcelową wędrówkę, by szczekać. On ją słyszy; słyszy go. Myśli: „Och, nie mogę pozwolić jej odejść zbyt daleko; ona mnie zablokuje”. Myśli: „Och, nie mogę pozwolić mu odejść zbyt daleko; obudzi mnie w środku nocy swoim szczekaniem”. Każdy ocenia, jak daleko jest drugi, i przesuwa się, aby częściowo wypełnić tę lukę.

Odpowiedzi:


18

Wartość p jest miarą tego, jak zawstydzające są dane w stosunku do hipotezy zerowej

Nicholas Maxwell, Data Matters: Conceptual Statistics for a Random World Emeryville CA: Key College Publishing, 2004.


15
  1. Jeśli wyrzeźbiłeś swój rozkład (histogram) z drewna i próbowałeś zrównoważyć go na palcu, punkt równowagi byłby wartością średnią, bez względu na kształt rozkładu.

  2. Jeśli umieścisz drążek na środku wykresu rozrzutu i przymocujesz drążek do każdego punktu danych za pomocą sprężyny, punktem spoczynkowym drążka będzie linia regresji. [1]

[1] technicznie byłaby to regresja głównych składników. musiałbyś zmusić sprężyny do poruszania się tylko „pionowo”, aby były najmniejsze kwadraty, ale przykład jest ilustracyjny w obu przypadkach.


2
Siła sprężyny jest proporcjonalna do odkształcenia, więc nie jest to regresja najmniejszych kwadratów!
shabbychef

1
Niezła próba! Zależy od wiosny. Na przykład, jeśli stała sprężyny wynosi 1 / sigma, działa świetnie;)
Neil McGuigan

2
L1y

L1L1

12

Wcześniej chodziłem po pijaku do przypadkowego spaceru, a pijana i jej pies do kointegracji; są bardzo pomocni (częściowo dlatego, że są zabawni).

Jednym z moich ulubionych wspólnych przykładów jest Birthday Paradox ( wpis na Wikipedii ), który ilustruje niektóre ważne pojęcia prawdopodobieństwa. Możesz to zasymulować w pokoju pełnym ludzi.

Nawiasem mówiąc, zdecydowanie polecam „Teaching Statistics: A Bag of Tricks” Andrew Gelmana, aby uzyskać przykłady kreatywnych metod nauczania pojęć statystycznych (patrz spis treści ). Spójrz również na jego artykuł na temat kursu, który uczy na temat nauczania statystyki: „Kurs na temat nauczania statystyki na poziomie uniwersyteckim” . I na temat „Nauczanie Bayesa doktorantom z zakresu nauk politycznych, socjologii, zdrowia publicznego, edukacji, ekonomii, ...” .

Przy opisywaniu metod bayesowskich używanie nieuczciwej monety i wielokrotne jej rzucanie jest dość powszechnym / skutecznym podejściem.


1
Nie ma czegoś takiego jak nieuczciwa moneta: stat.columbia.edu/~gelman/research/published/diceRev2.pdf
Tim

11

Lubię zademonstrować zmienność próbkowania i zasadniczo twierdzenie o limicie centralnym poprzez ćwiczenie „w klasie”. Wszyscy w klasie mówią, że 100 uczniów zapisuje swój wiek na kartce papieru. Wszystkie kawałki papieru są tego samego rozmiaru i złożone w ten sam sposób po obliczeniu średniej. To jest populacja i ja obliczam średni wiek. Następnie każdy uczeń losowo wybiera 10 kawałków papieru, zapisuje wieki i zwraca je do torby. (S) oblicza średnią i podaje torbę do następnego ucznia. W końcu mamy 100 próbek po 10 studentów, z których każdy szacuje średnią liczbę ludności, którą możemy opisać za pomocą histogramu i niektórych statystyk opisowych.

Następnie tym razem powtarzamy demonstrację, używając zestawu 100 „opinii”, które replikują niektóre pytania Tak / Nie z ostatnich sondaży, np. Jeśli jutro zwołane zostaną wybory (Brytyjskiego generała), czy rozważysz głosowanie na Brytyjską Partię Narodową. Uczniowie próbują 10 z tych opinii.

Na koniec zademonstrowaliśmy zmienność próbkowania, Twierdzenie o granicy centralnej itp. Z danymi ciągłymi i binarnymi.


10

Zdecydowanie problem Monty Hall. http://en.wikipedia.org/wiki/Monty_Hall_problem


1
+1 ten problem przekręcił mi mózg, kiedy po raz pierwszy przeczytałem i pomyślałem o nim - a rozwiązanie jest dość proste, ale wiele mówi o prawdopodobieństwie.
Sharpie

1
Uważam, że problem Monty Hall nie jest prostym wyjaśnieniem prawdopodobieństwa laika. Rozumiem to, ale nadal mam trudności z owinięciem głowy wokół, nie mówiąc już o zrozumieniu go wystarczająco dobrze, aby wyjaśnić to osobie niebędącej statystyką i pozwolić mu się czegoś nauczyć ... W każdym razie nie określasz, czy problem jest twoją trudną koncepcją lub wyjaśnieniem twojego laika . -1, dopóki nie zrobisz.
naught101

2
Najłatwiejszym sposobem wyjaśnienia problemu Monty Hall jest wyobrażenie sobie tego samego problemu, ale przy 1000 drzwiach - 999 z nich ma kozę za sobą, a tylko 1 z nich ma za sobą samochód. Załóżmy, że wybierasz drzwi, a gospodarz teleturnieju otwiera 998 innych drzwi i pyta, czy chcesz zmienić decyzję na jedne drzwi, których nie otworzył. Wiedząc, że nie mógł on otworzył drzwi samochodu za to, byś miał do przejścia na drugie drzwi (lub być śmiesznie pewność, że masz rację w swojej początkowej wyboru).
Berk U.

10

1) Dobra prezentacja tego, jak należy zdefiniować „losowy”, aby ustalić prawdopodobieństwo wystąpienia określonych zdarzeń:

Jaka jest szansa, że ​​losowa linia narysowana na okręgu będzie dłuższa niż promień?

Pytanie całkowicie zależy od tego, jak narysujesz swoją linię. Możliwości, które można opisać w realnym świecie dla okręgu narysowanego na ziemi, mogą obejmować:

Narysuj dwa losowe punkty wewnątrz okręgu i narysuj linię przez nie. (Zobacz, gdzie spadają dwie muchy / kamienie ...)

Wybierz stały punkt na obwodzie, a następnie losowy w innym miejscu w okręgu i dołącz do nich. (W efekcie powoduje to kij w poprzek koła pod zmiennym kątem przez dany punkt i losowy, np. W miejscu, w którym spada kamień).

Narysuj średnicę. Losowo wybierz punkt wzdłuż niego i narysuj przez niego prostopadłość. (Przetocz kij wzdłuż linii prostej, tak aby spoczywał na okręgu).

Stosunkowo łatwo jest pokazać komuś, kto potrafi wykonać pewną geometrię (ale niekoniecznie statystyki), odpowiedź na pytanie może być bardzo zróżnicowana (od około 2/3 do około 0,866 lub więcej).

(1210)

3) Wyjaśnienie, dlaczego diagnoza medyczna może wydawać się naprawdę wadliwa. Test na foo choroby, który jest w 99,9% dokładny w identyfikacji tych, którzy go mają, ale. 1% fałszywie pozytywnie diagnozuje tych, którzy tak naprawdę go nie mają, może wydawać się błędny tak często, gdy częstość występowania choroby jest naprawdę niska ( np. 1 na 1000), ale wielu pacjentów jest na to testowanych.

To najlepiej wyjaśnić liczbami rzeczywistymi - wyobraź sobie, że 1 milion ludzi jest testowanych, więc 1000 ma chorobę, 999 jest poprawnie zidentyfikowanych, ale 0,1% z 999,000 to 999, którym powiedziano, że mają, ale nie mają. Tak więc połowa tych, którym powiedziano, że tak, faktycznie tego nie robi, pomimo wysokiego poziomu dokładności (99,9%) i niskiego poziomu fałszywych trafień (0,1%). Drugi (idealnie inny) test rozdzieli te grupy.

[Nawiasem mówiąc, wybrałem liczby, ponieważ są one łatwe w obsłudze, oczywiście nie muszą się sumować do 100%, ponieważ dokładność / współczynnik fałszywie dodatnich wyników jest niezależnym czynnikiem w teście.]


2
Myślę, że twój pierwszy przykład odnosi się do paradoksu Bertranda. Bardzo ładna ilustracja różnych sposobów definiowania przestrzeni probabilistycznej!
chl

9

Książka Sama Savage'a Flaw of Averages jest wypełniona dobrymi świeckimi objaśnieniami pojęć statystycznych. W szczególności ma dobre wytłumaczenie nierówności Jensena. Jeśli wykres zwrotu z inwestycji jest wypukły, tzn. „Uśmiecha się do ciebie”, przypadkowość jest na twoją korzyść: średni zwrot jest większy niż średni zwrot.



6

Behar i wsp. Mają zbiór 25 analogii do nauczania statystyki. Oto dwa przykłady:

2.9 Wszystkie modele są teoretyczne: We wszechświecie nie ma idealnych sfer Wydaje się, że najczęstszą formą geometryczną we wszechświecie jest kula. Ale ile jest matematycznie doskonałych sfer we wszechświecie? Odpowiedź brzmi: nie. Ani Ziemia, ani Słońce, ani kula bilardowa nie są idealną kulą. Jeśli więc nie ma prawdziwych sfer, jakie są dobre wzory na ustalenie powierzchni lub objętości kuli? Tak samo jest w przypadku modeli statystycznych, aw szczególności z rozkładem normalnym. Chociaż jednym z najczęstszych przykładów jest rozkład wysokości, gdybyśmy mieli do dyspozycji wysokość każdej osoby dorosłej na planecie, profil histogramu nie odpowiadałby krzywej dzwonowej Gaussa, nawet gdyby dane były stratyfikowane według płci, rasa lub inna cecha.

2.25 Resztki nie powinny zawierać informacji: Resztki worków na śmieci pozostają po usunięciu wszystkich informacji z danych. Ponieważ nie powinny one zawierać żadnych informacji, uważamy je za „śmieci”. Należy upewnić się, że nie wyrzucamy śmieci o wartości (informacji), które można wykorzystać w celu lepszego wyjaśnienia zachowania zmiennej zależnej.

Inne przykłady obejmują

  • „Wpływ wielkości próbki na porównanie zabiegów: powiększenie lornetki”
  • „Wielkość próbki a wielkość populacji: łyżka do degustacji zupy”

Referencje

  • Behar, R., Grima, P., i Marco-Almagro, L. (2012). Dwadzieścia pięć analogii dla wyjaśnienia pojęć statystycznych. The American Statistician, (właśnie przyjęty).

3

Zabawne pytanie.

Ktoś odkrył, że pracuję w biostatystyce i zapytał mnie (w zasadzie) „Czy statystyki nie są tylko kłamstwem?”

(Co przywraca cytat Marka Twaina o kłamstwach, przeklętych kłamstwach i statystykach).

Próbowałem wyjaśnić, że statystyki pozwalają nam ze 100 procentową precyzją stwierdzić, że przy założeniach i danych dane, że prawdopodobieństwo takiego i takiego było dokładnie takie a takie.

Nie była pod wrażeniem.


1
„Pozwala nam powiedzieć, ze 100% precyzją, dokładnie, jak duży jest nasz brak precyzji”
naught101

Jeśli nie jest to wprost obalenie, odpowiedź @ Jeromy sugeruje, dlaczego pojęcie „100% precyzji” powinno zostać odrzucone.
rolando2
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.