Dlaczego 600 na 1000 jest bardziej przekonujących niż 6 na 10?


41

Spójrz na ten fragment z „Podręcznika umiejętności uczenia się”, Palgrave, 2012, autorstwa Stelli Cottrell, strona 155:

Procenty Zauważ, kiedy podane są procenty.
Załóżmy, że powyższe oświadczenie brzmi:

60% osób preferowało pomarańcze; 40% stwierdziło, że wolą jabłka.

Wygląda to przekonująco: podano wartości liczbowe. Ale czy różnica między 60% a 40% jest znacząca ? Tutaj musielibyśmy wiedzieć, ile osób zostało zapytanych. Gdyby zapytać 1000 osób, z których 600 preferowało pomarańcze, liczba ta byłaby przekonująca. Jednak jeśli zapytano tylko 10 osób, 60% oznacza po prostu, że 6 osób woli pomarańcze. „60%” brzmi przekonująco w taki sposób, że „6 na 10” nie. Jako krytyczny czytelnik musisz uważać na odsetki wykorzystane do tego, aby niewystarczająca ilość danych wyglądała imponująco.

Jak nazywa się ta cecha w statystykach? Chciałbym przeczytać więcej na ten temat.


38
liczebność próby ma znaczenie
Aksakal

36
Wybieram losowo dwie osoby, obie są płci męskiej i dlatego dochodzę do wniosku, że 100% Amerykanów to mężczyźni. Przekonujący?
Casey

2
Jest to zasada „Nie porównuj jabłek z pomarańczami”
wilki

2
Aby podejść do tego pytania z innej perspektywy, możesz rozważyć przejrzenie literatury na temat efektu kadrowania. Jest to jednak przykład uprzedzeń poznawczych i jest to temat psychologiczny, a nie statystyczny.
Larx,

2
Możesz sobie wyobrazić różnicę 1, w jakim stopniu wpłynie to na oszacowaną ilość. 7/10 jest znacznie dalej od 6/10 niż 601/1000 od 600/1000.
matreadler

Odpowiedzi:


54

Chciałbym wymienić kolejny intuicyjny przykład.

Załóżmy, że powiem ci, że mogę przewidzieć wynik każdego rzutu monetą. Nie wierzysz i chcesz przetestować moje umiejętności.

Przetestowałeś 5 razy, a ja mam je wszystkie poprawnie. Czy wierzysz, że mam specjalną zdolność? Może nie. Ponieważ mogę je wszystkie przypadkowo dobrać. (W szczególności załóżmy, że moneta jest uczciwą monetą, a każdy eksperyment jest niezależny, wtedy mogę uzyskać wszystkie prawa z bez supermocy. Zobacz dowcip na ten temat w linku Shufflepants ).0.550.03

Z drugiej strony, jeśli przetestowałeś mnie wiele razy, to jest bardzo mało prawdopodobne, że uda mi się to zdobyć przez przypadek. Na przykład, jeśli testowałeś razy, prawdopodobieństwo, że je wszystkie poprawię, wynosi .0,5 10001000.51000


Pojęcie statystyczne nazywa się „moc statystyczna” od Wikipeida

Moc binarnego testu hipotezy to prawdopodobieństwo, że test poprawnie odrzuci hipotezę zerową (H0), gdy hipoteza alternatywna (H1) jest prawdziwa.

Wróć do przykładu super power on flip flip, w zasadzie chcesz przeprowadzić test hipotez.

  • Hipoteza zerowa (H0): Nie mam super mocy
  • Alternatywna hipoteza (H1): Mam super moc

Teraz, jak widać na przykładzie numerycznym (przetestuj mnie 5 razy vs przetestuj mnie 100 razy), na wielkość statystyczną wpłynęła wielkość próbki.

Więcej do przeczytania tutaj . (bardziej techniczny i oparty na t-teście).

Interaktywne narzędzie do zrozumienia siły statystycznej można znaleźć tutaj . Uwaga, moc statystyczna zmienia się wraz z wielkością próbki!

wprowadź opis zdjęcia tutaj


24
Obligatory XKCD
Shufflepants

5
To tak naprawdę nie odpowiada na pytanie. Pytanie składa się z dwóch części: „Dlaczego [to] jest bardziej przekonujące ...” i „Jak nazywa się to w statystykach?” Podałeś przykład, który pyta czytelnika, czy ten przykład jest bardziej przekonujący, ale nie wyjaśniłeś tego zjawiska ani nie próbowałeś wyjaśnić, dlaczego jest on bardziej przekonujący (polegając tylko na intuicyjnym rozumowaniu czytelnika na jednym przykładzie). Ponadto nie poruszyłeś drugiego pytania: jeśli uważasz, że to zjawisko nie ma nazwy, to wyraźnie to zaznacz.
Makyen

1
@Mayken To po prostu próba odpowiedzi. To nie jest najlepsza odpowiedź i nie jest to pełna odpowiedź, ale częściowe lub socjokratyczne odpowiedzi nie są podstawą do twierdzenia, że ​​to wcale nie jest odpowiedź. Pytania powinny zadać jedno pytanie, a jeśli zadają serię pytań, myślę, że całkowicie rozsądne (jeśli mniej niż idealne) jest zajęcie się tylko niektórymi z nich. Jeśli uważasz, że to kiepska odpowiedź, z pewnością możesz rozwiązać problemy, które widzisz jako problemy. [W tej kwestii nie sądzę, żebym odpowiedział na drugie pytanie; Omówiłem tylko efekt; nie każde zjawisko będzie miało jednoznaczną nazwę]
Glen_b

1
Nie mogę się oprzeć wrażeniu, że 100% to szczególny przypadek, a ta odpowiedź nie potwierdza mojej intuicji, że 600/1000 jest bardziej przekonujący niż 6/10. Nawet jeśli uznamy, że nie jest to szczególny przypadek, to w gruncie rzeczy po prostu przywraca problem z innym procentem.
NotThatGuy

2
@Juya to narzędzie internetowe zbudowane przez kogoś. Możesz spróbować tutaj
Haitao Du

29

μ=# of sucessesn

μ(1μ)n.155.0155


17

Ta koncepcja jest konsekwencją prawa wielkich liczb . Z Wikipedii ,

Zgodnie z prawem średnia wyników uzyskanych z dużej liczby prób powinna być zbliżona do wartości oczekiwanej i będzie się zbliżać w miarę przeprowadzania większej liczby prób.

Wyniki z małej próbki mogą być dalej od wartości oczekiwanej niż z większej próbki. Tak więc, jak stwierdzono w pytaniu, należy zachować ostrożność w przypadku wyników obliczonych z małych próbek. Pomysł jest również dość dobrze wyjaśniony w tym filmie na YouTubie .


5
Istnieje kilka dobrze znanych twierdzeń znanych w statystyce jako „prawa wielkich liczb”, ale żadne z nich nie zawiera stwierdzeń, które wyglądają tak, jak w pytaniu. Jak zatem nawiązać połączenie?
whuber

3
Z wikipedia en.wikipedia.org/wiki/Law_of_large_numbers : „Zgodnie z prawem średnia wyników uzyskanych z dużej liczby prób powinna być zbliżona do oczekiwanej wartości i będzie się zbliżać w miarę przeprowadzania większej liczby prób” . Wyniki z małej próbki mogą być dalej od wartości oczekiwanej niż z większej próbki. Tak więc, jak stwierdzono w pytaniu, należy zachować ostrożność w przypadku wyników obliczonych z małych próbek.
Evan Phibbs,

6
To dobre wytłumaczenie, dziękuję. Chociaż masz rację, pisząc, że należy zachować ostrożność w kwestii tego, ile „dużej liczby prób” musi mieć zaufane prawo, aplikacja jest intuicyjna. Chciałbym zasugerować, że twoje wyjaśnienie należy do twojej odpowiedzi, gdzie byłoby szerzej czytane i doceniane, niż zakopane w komentarzu. Odpowiedzi zawierające tylko linki (takie jak link do YouTube) bez wyjaśnienia nie trwają tutaj.
whuber

6

Jesteśmy w stanie oszacować pewną liczbę populacji według pewnej liczby próbek. W tym przypadku używamy proporcji próby do oszacowania proporcji populacji, ale zasada jest znacznie bardziej ogólna.

10101

Gdy bierzemy coraz większe próbki (przy użyciu losowego próbkowania), średnie próbek będą miały tendencję do zbliżania się do średniej populacji. (To jest prawo wielkich liczb.)

Jednak tak naprawdę chcemy mieć pojęcie o tym, jak daleko jesteśmy (np. Może to być reprezentowane przez szerokość przedziału ufności dla proporcji lub margines błędu, który zwykle wynosi połowę takiej szerokości) .

120

1n

W rezultacie jesteśmy bardziej pewni dokładności naszego oszacowania, gdy próbka jest duża - jeśli powtórzymy nasz eksperyment ponownie, inne takie środki byłyby zbliżone do obecnego - skupiają się coraz ściślej i ponieważ (w tym przypadku) nasze oszacowanie jest obiektywne, gromadzą się wokół wartości, które próbujemy oszacować. Średnia z pojedynczej próby staje się coraz bardziej informująca o tym, gdzie może być średnia populacji.


4

Podstawową zasadą w przypadku „liczenia” statystyk, takich jak liczenie osób lubiących pomarańcze lub liczenie „kliknięć” w liczniku Geigera z powodu rozpadu radioaktywnego, jest to, że margines błędu dla zliczania jest mniej więcej kwadratem -root oczekiwanej wartości zliczania. Znane są statystyki zliczania to statystyki Poissona.

Pierwiastek kwadratowy z 6 wynosi 2,4, więc margines błędu wynosi około 40% (2,4 / 6). Pierwiastek kwadratowy z 600 wynosi 24, więc margines błędu wynosi około 4% (24/600). Dlatego liczenie 600 jest bardziej znaczące niż liczenie 6. Błąd względny wynosi jedną dziesiątą.

Jestem trochę niechlujny w kwestii definicji marginesu błędu. To tak naprawdę wartość 1-sigma i nie jest to trudne ograniczenie, ale jest to zakres, w którym spodziewana jest większość (68%) pomiarów. Więc jeśli oczekujesz 6 pomarańczowych zjadaczy, spodziewałbyś się, że seria sondaży da ci głównie liczby w przedziale od 4 do 8, np. 6,6,5,6,7,2,4,6,3,5,6, 6,7,6,10,8,6,5,6,6,9,3,7,8.


3

Nie mam nazwy, której szukasz, ale problem nie jest statystyczny. Psychologicznie sposób, w jaki ludzie przetwarzają liczby w naszych mózgach, przypisuje większą wagę (autorytet) większym liczbom niż mniejszym liczbom, ponieważ wielkość (rozmiar fizyczny) jest wizualnie równie ważna jak wartość reprezentatywna. Zatem 600/1000 wydaje się bardziej wiarygodny niż 6/10. Dlatego kupujący wolą widzieć „10% zniżki!” dla wartości mniejszych niż 100 i „Oszczędź 10 $!” dla wartości powyżej 100 (zwanych „regułą 100”). Chodzi o to, jak nasze mózgi reagują na percepcję.

Niesamowite spojrzenie na to i podobne zjawiska omawia Nick Kolenda w swoim internetowym traktacie „ Ogromny przewodnik po psychologii cen ”.


2
Chociaż inne odpowiedzi nie są niepoprawne, nie widzę ich w rzeczywistości poprawnych adresach cytowanego tekstu. Tekst dotyczy wpływu przedstawiania liczb i postrzeganej dokładności, nie jeśli liczby faktycznie są dokładniejsze. Oznacza to, że możesz sprawić, że osoba zauważy, że twoje informacje są ważniejsze, mówiąc 600 z 1000 lub 60%, lub możesz sprawiać wrażenie mniej znaczącego, mówiąc 6 z 10, mimo że każda oznacza to samo, sugerując mniejszą próbkę rozmiar bez faktycznego podania, a nawet być może prawdziwy.
dlb

1
Ten przykład wydaje mi się zasadniczo wadliwy. Na przykład zakup 100 otrzymuje rabat 10% w sumie 90, podczas gdy zakup 100,01 dostaje rabat 25 w sumie 75,01, co daje zupełnie inną cenę. W rzeczywistości istnieje różnica wartości, dopóki nie dojdziesz do 250,05 (lub 250,10 w zależności od zaokrąglenia lub obcięcia). Pytanie dotyczy wielkości próby i standardowego błędu, podczas gdy twój przykład dotyczy bardziej rzeczywistej różnicy z powodu naszej percepcji.
Joe W

@Joe W, chociaż nie mogę mówić o szczegółach „reguły 100” (nie bycie psychologiem), moja odpowiedź polega na tym, że psychologowie ustalili, że ludzie ufają większej liczbie osób, nie z powodu większej reprezentuje wielkość próby, ale ze względu na postrzeganie większego znaczenia przypisywanego większej liczbie. Jako inżynier wolałbym, żeby tak nie było - ale tak działa ludzki umysł. Jeśli chcesz temu zakwestionować, polecam przeczytanie podstawowych szczegółów prezentacji pana Kolendy.
JBH

Tęsknisz za moim punktem, istnieje większa różnica w 10% do 100, a 25 to nie tylko kwestia percepcji. Prostym faktem jest, że jeśli weźmiesz obie wartości na 100, różnica wynosi 15%, co jest wartością, która jest o wiele łatwiejsza do zmierzenia, niż błąd standardowy, gdy mówimy o dwóch różnych próbkach, jednej z 10 i jednej z 1000.
Joe W

Zmieniłem swoje pytanie, aby użyć 10% i 10 USD, aby ci pomóc. Punktem „reguły 100” jest to, że ludzie postrzegają większe liczby jako mające większe znaczenie i postrzegają wartość pieniężną jako ważniejszą niż zwykły procent. Jest to kwestia nieco poza zakresem dyskusji dla celów PO.
JBH

3

Chociaż rzeczywisty margines błędu jest ważny, powodem, dla którego brzmi on bardziej przekonująco, jest bardziej heurystyczne (reguła) doświadczenie z ludźmi. Rzeczywisty margines błędu potwierdza, że ​​ta heurystyka ma swoje zalety.

Jeśli próbka to 6 za, a 4 przeciw, może to być 50/50, jeśli jedna osoba zmieni swój głos lub jedna osoba zostanie błędnie odnotowana. Po stronie 6 są tylko dwie osoby. Wszyscy znają dwa płatki, wszyscy wiedzą, że próbka może zostać wybrana: zapytaliście tylko kelnerki i nikogo innego. Albo sondowałeś tylko 10 profesorów uniwersyteckich w salach uniwersyteckich. Albo zapytałeś 10 bogatych ludzi poza Saks Fifth Avenue.

Nawet matematyczny margines błędu zakłada prawdziwą przypadkowość i nie uwzględnia stronniczości selekcji, uprzedzeń autoselekcji ani niczego innego, ludzie mogą to intuicyjnie zrozumieć.

Dla porównania, wynik 600 vs. 400 ma z jednej strony o 200 więcej osób, a 100 osób musiałoby zmienić zdanie. Liczby te są bardzo trudne do zdobycia (ale nie niemożliwe) przez jakiś przypadek miejsca, w którym przeprowadzałeś ankietę, w jaki sposób sprawiłeś, że ludzie się zgodzili, jak ludzie zrozumieli lub zinterpretowali pytanie itp.

Jest to bardziej przekonujące nie ze względu na matematyczny dowód, że tak powinno być, ale ponieważ wiemy z doświadczenia, że ​​tłumy 1000 są znacznie bardziej zróżnicowane w swoich opiniach (na cokolwiek) niż grupa 10. (chyba że potajemnie to zrobiłeś) Twoje ankiety na zjeździe partii politycznej, wiecu KKK lub czymś innym, co może przyciągnąć jednostronny tłum).

Matematyka precyzyjnie określa ilościowo to, co wiemy już intuicyjnie; że łatwiej jest losowo napotkać jeden lub dwa zabłąkane głosy na 10, niż przypadkowo napotkać 100 lub 200 zabłąkanych głosów na 1000.


3

Coś, o czym nie wspomniano, to spojrzenie na problem z bayesowskiego punktu widzenia.

pp

pBeta(α,β)no|pBin(n,p).

β=αβ=α=1pU(0,1)

nnona=nno

p

p|no,naBeta(no+1,na+1).

pno/(no+na)n

no=6na=4

z tyłu przy n_o = 6 i n_a = 4

no=600na=400wprowadź opis zdjęcia tutaj

p=0.4p=0.8

Pamiętaj, że chociaż te wykresy wyglądają podobnie do david25272, reprezentują coś zupełnie innego .

pno

nop


2

Krótka odpowiedź:

Zasadniczo bardziej przekonujące jest posiadanie 600 na 1000 niż sześć na 10, ponieważ przy równych preferencjach jest znacznie bardziej prawdopodobne, że 6 na 10 wystąpi przypadkowo.

Załóżmy, że odsetek, który preferował pomarańcze i jabłka, jest w rzeczywistości równy (czyli 50% każdy). Nazwij to hipotezą zerową. Biorąc pod uwagę te równe prawdopodobieństwa, prawdopodobieństwo tych dwóch wyników jest następujące:

  • Biorąc pod uwagę próbę 10 osób, istnieje 38% szansa na losowe pobranie próbki 6 lub więcej osób, które wolą pomarańcze (co nie jest wcale takie mało prawdopodobne).
  • Przy próbie 1000 osób istnieje mniej niż 1 na miliard szans, że 600 lub więcej z 1000 osób woli pomarańcze.

(Dla uproszczenia zakładam nieskończoną populację, z której można pobrać nieograniczoną liczbę próbek).


Prosta pochodna

Jednym ze sposobów uzyskania tego wyniku jest po prostu wymienienie potencjalnych sposobów łączenia ludzi w naszych próbkach:

Dla dziesięciu osób jest to łatwe:

Rozważ losowe pobranie próbek 10 osób z nieskończonej populacji osób o równych preferencjach dotyczących jabłek lub pomarańczy. Przy równych preferencjach łatwo jest po prostu wymienić wszystkie potencjalne kombinacje 10 osób:

Oto pełna lista.

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r jest liczbą wyników (osoby, które wolą pomarańcze), C jest liczbą możliwych sposobów, że wiele osób woli pomarańcze, a p jest wynikowym dyskretnym prawdopodobieństwem, że wiele osób woli pomarańcze w naszej próbie.

(p to tylko C podzielone przez całkowitą liczbę kombinacji. Zauważ, że istnieje 1024 sposobów na uporządkowanie tych dwóch preferencji łącznie (tj. 2 do potęgi 10).

  • Na przykład istnieje tylko jeden sposób (jedna próbka) na 10 osób (r = 10), aby wszyscy preferowali pomarańcze. To samo dotyczy wszystkich osób preferujących jabłka (r = 0).
  • Istnieje 10 różnych kombinacji, z czego dziewięć preferuje pomarańcze. (Jedna inna osoba woli jabłka w każdej próbce).
  • Istnieje 45 próbek (kombinacji), w których 2 osoby wolą jabłka itp.

(Ogólnie rzecz biorąc mówimy o n C r kombinacjach wyników r z próbki n osób. Istnieją kalkulatory online, których można użyć do weryfikacji tych liczb.)

Ta lista pozwala nam podać powyższe prawdopodobieństwa za pomocą tylko podziału. Istnieje 21% szansy na uzyskanie 6 osób w próbie, które wolą pomarańcze (210 z 1024 kombinacji). Szansa na uzyskanie sześciu lub więcej osób w naszej próbie wynosi 38% (suma wszystkich próbek z sześcioma lub więcej osobami lub 386 z 1024 kombinacji).

Graficznie prawdopodobieństwa wyglądają tak:

wielkość próbki dwumianowej 10

Przy większych liczbach liczba potencjalnych kombinacji szybko rośnie.

Dla próbek liczących zaledwie 20 osób istnieje 1 048 576 możliwych próbek, wszystkie z jednakowym prawdopodobieństwem. (Uwaga: Pokazałem tylko co drugą kombinację poniżej).

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

Jest tylko jedna próbka, w której wszystkie 20 osób woli pomarańcze. Kombinacje zawierające mieszane wyniki są znacznie bardziej prawdopodobne, po prostu dlatego, że istnieje wiele innych sposobów łączenia osób w próbkach.

Próbki, które są stronnicze, są znacznie bardziej mało prawdopodobne, tylko dlatego, że istnieje mniej kombinacji osób, które mogą powodować takie próbki:

Przy zaledwie 20 osobach w każdej próbie skumulowane prawdopodobieństwo posiadania 60% lub więcej (12 lub więcej) osób w naszej próbie preferujących pomarańcze spada do zaledwie 25%.

Widać, że rozkład prawdopodobieństwa staje się cieńszy i wyższy:

wielkość próbki dwumianowej 20

Przy 1000 osób liczby są ogromne

Możemy rozszerzyć powyższe przykłady na większe próbki (ale liczby rosną zbyt szybko, aby można było wymienić wszystkie kombinacje), zamiast tego obliczyłem prawdopodobieństwa w R:

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

Skumulowane prawdopodobieństwo posiadania 600 lub więcej spośród 1000 osób woli pomarańcze to tylko 1,364232e-10.

Rozkład prawdopodobieństwa jest teraz znacznie bardziej skoncentrowany wokół centrum:

[wielkość próbki dwumianowej 1000 [3]

(Na przykład, aby obliczyć prawdopodobieństwo dokładnie 600 z 1000 osób preferujących pomarańcze w użyciu R, dbinom(600, 1000, prob=0.5)co wynosi 4,633908e-11, a prawdopodobieństwo 600 lub więcej osób wynosi 1-pbinom(599, 1000, prob=0.5), co równa się 1,364232e-10 (mniej niż 1 na miliard).


1

Jest tak, ponieważ wyższa liczba zapewnia większą dokładność. Na przykład, jeśli wybrałbyś 1000 losowych ludzi z dowolnego miejsca na świecie, a 599 z nich to mężczyźni przeciwko 10 losowym ludziom z 6 mężczyznami, ten pierwszy byłby dokładniejszy. Podobnie, jeśli przyjmiesz populację wynoszącą 7 miliardów i obliczasz liczbę mężczyzn, uzyskasz dokładniejszą liczbę, która byłaby oczywiście bardziej przekonująca niż w przypadku zaledwie 1000 osób.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.