Dlaczego błąd standardowy proporcji dla danego n jest największy dla 0,5?


10

Standardowy błąd proporcji będzie największy, jaki może być dla danego N, gdy proporcja wynosi 0,5, a zmniejsza się wraz ze wzrostem proporcji od 0,5. Rozumiem, dlaczego tak jest, gdy patrzę na równanie błędu standardowego proporcji, ale nie mogę tego dalej wyjaśniać.

Czy istnieje wyjaśnienie poza matematycznymi właściwościami formuły? Jeśli tak, to dlaczego jest mniej niepewności co do szacunkowych proporcji (dla danego N), gdy zbliżają się do 0 lub 1?

Odpowiedzi:


8

Tło i terminologia

Aby wyjaśnić, o czym dyskutujemy, ustalmy kilka pojęć i terminologię. Dobrym modelem proporcji jest urna binarna: zawiera kulki w kolorze srebrnym („sukces”) lub fuksja („porażka”). Proporcja srebrnych kulek w urnie wynosi (ale nie o tej proporcji będziemy mówić). p

Ta urna zapewnia sposób na modelowanie próby Bernoulli . Aby uzyskać jedną realizację, dokładnie wymieszaj kulki i ślepo wyciągnij jedną, obserwując jej kolor. Aby uzyskać dodatkowe realizacje, należy najpierw odtworzyć pudełko, zwracając narysowaną piłkę, a następnie powtórzyć procedurę określoną liczbę razy. Sekwencja realizacje mogą być przedstawione przez zliczania sukcesów, . Jest to zmienna losowa, której właściwości są całkowicie określone przez i . Rozkład nazywa się rozkładem dwumianowym . Proporcja (eksperymentalna lub „próbka”) to stosuneknXnpX(n,p)X/n.

Postać

Liczby te są wykresami słupkowymi rozkładów prawdopodobieństwa dla różnych proporcji dwumianowych . Na uwagę zasługuje spójny wzór, niezależnie od , w którym rozkłady stają się węższe (a słupki odpowiednio wyższe), gdy przesuwa się z w dół.X/nnp1/2

Odchylenie standardowe jest standardowym błędem proporcji wspomnianym w pytaniu. Dla dowolnego liczba ta może zależeć tylko od . Nazwijmy to . Zmieniając role piłek - nazywając te srebrne „awariami”, a fuksja „sukcesami”, łatwo zauważyć, że . Zatem sytuacja, w której - czyli musi być wyjątkowa. Pytanie dotyczy tego, jak zmienia się gdy przesuwa się z do bardziej ekstremalnej wartości, takiej jakX/nnpse(p)se(p)=se(1p)p=1pp=1/2se(p)p1/20.

Wiedza a zrozumienie

Ponieważ wszystkim pokazano takie liczby na wczesnym etapie edukacji, wszyscy „znają” szerokości wykresów - mierzone za pomocą muszą się zmniejszać, gdy odsuwa się od . Ale ta wiedza to tak naprawdę tylko doświadczenie, podczas gdy pytanie dąży do głębszego zrozumienia. Takie zrozumienie jest dostępne dzięki dokładnej analizie rozkładów dwumianowych, takich jak Abraham de Moivre przeprowadzony około 300 lat temu. (Były one w duchu podobne do tych, które przedstawiłem w dyskusji na temat twierdzenia o granicy centralnej .) Myślę jednak, że niektóre względnie proste rozważania mogą wystarczyć, aby stwierdzić, że szerokości muszą być najszersze w pobliżu .se(p)p1/2p=1/2

Prosta intuicyjna analiza

Oczywiste jest, że należy oczekiwać, że odsetek sukcesów w eksperymencie będzie zbliżony do . Standardowy błąd dotyczy tego, jak daleko od tego oczekiwania można zasadnie przypuszczać, że rzeczywisty wynik będzie leżał. Przypuśćmy, że bez utraty ogólności, że wynosi od do , co trzeba zrobić, aby zwiększyć od ? Zazwyczaj około kul narysowanych w eksperymencie było srebrnych i (dlatego) około było fuksją. Aby uzyskać więcej srebrnych kulek, niektóre z tychpX/np01/2X/nppn(1p)npnwyniki fuksji musiały się różnić. Jak prawdopodobne jest, że ta szansa może działać w ten sposób? Oczywistą odpowiedzią jest to, że gdy jest małe, nigdy nie jest bardzo prawdopodobne, że narysujemy srebrną piłkę. Dlatego nasze szanse na wyciągnięcie srebrnych kulek zamiast fuksyjnych są zawsze niskie. Możemy mieć uzasadnioną nadzieję, że przy odrobinie szczęścia część wyników fuksji mogłaby się różnić, ale wydaje się mało prawdopodobne, aby zmieniło się o wiele więcej. Jest zatem prawdopodobne, że nie zmienia się o wiele więcej niż . Równolegle nie zmienia się o wiele więcej niż .ppXp×(1p)nX/np(1p)n/n=p(1p)

finał

Tak więc pojawia się magiczna kombinacja . p(1p) To właściwie rozwiązuje pytanie: oczywiście ta ilość osiąga wartość szczytową przy i spada do zera przy lub . Zapewnia intuicyjne, ale ilościowe uzasadnienie dla twierdzeń, że „jedna skrajność jest bardziej ograniczająca niż druga” lub innych takich prób opisania tego, co wiemy.p=1/2p=0p=1

Jednak nie jest całkiem poprawna wartość: to tylko wskazuje drogę, mówiąc nam, co ilość powinna znaczenia dla oceny rozprzestrzeniania . Zignorowaliśmy fakt, że szczęście również działa przeciwko nam: tak jak niektóre kulki w kolorze fuksji mogły być srebrne, niektóre srebrne kule mogły być w kolorze fuksji. Rachunkowość dla wszystkich możliwości rygorystycznie może się komplikują, ale rezultat jest taki, że zamiast używać w rozsądnych granicach, ile mógłby odstąpić od jej oczekiwań , w celu uwzględnienia wszystkich możliwych wyników właściwie mamy wziąć pierwiastek kwadratowyp(1p)Xp(1p)nXpn p(1p)n. (W celu dokładniejszego wyjaśnienia dlaczego, odwiedź stronę ( https://stats.stackexchange.com/a/3904 .) Dzieląc przez , dowiadujemy się, że losowe zmiany proporcji powinny być rzędu który jest standardowym błędem .nX/np(1p)n/n=p(1p)n,X/n


3

Rozważ funkcję p (1-p) dla 0 <= p <= 1. Używając rachunku różniczkowego, możesz zobaczyć, że przy p = 1/2 jest to 1/4, co jest wartością maksymalną. Jeśli widzisz, że dotyczy to dwumianu związanego ze standardowym odchyleniem oszacowania proporcji, która jest sqrt (p (1-p) / n), to p = 1/2 jest wartością maksymalną. Gdy p = 1 lub 0, standardowym błędem jest 0, ponieważ zawsze dostaniesz odpowiednio wszystkie 1 lub wszystkie 0. Kiedy więc zbliżasz się do 0 lub 1, argument ciągłości mówi, że błąd standardowy zbliża się do 0, gdy p zbliża się do 0 lub 1. W rzeczywistości zmniejsza się monotonicznie, gdy p zbliża się do 0 lub 1. Dla dużego n szacowany odsetek powinien być zbliżony do rzeczywistego proporcja.


3
OP zauważył już, że „widzę, dlaczego tak jest, gdy patrzę na równanie błędu standardowego proporcji”. Dlatego uważam, że nie proszą oni o analizę wzoru , ale raczej o głębsze zrozumienie, dlaczego wzór - cokolwiek by to był - naprawdę powinien być maksymalizowany przy . p(1p)p=1/2
whuber

1
@ Whuber Odpowiedziałem tak, jak zrobiłem, ponieważ widzę, że formuła ma fundamentalne znaczenie dla zrozumienia, dlaczego wariancja jest największa przy p = 1/2 i bardzo mała, gdy p jest bliskie 0 lub 1. Może najlepiej powiedzieć, że nie ma żadnego wyjaśnienia całkowicie pozbawionego formuły.
Michael R.

1

Rozkład dwumianowy jest z grubsza symetryczny (dla dużych jest w przybliżeniu normalny ).n

Ponieważ stosunek musi wynosić od 0 do 1, niepewność będzie ograniczona tymi granicami. O ile średni stosunek nie jest dokładnie w środku, jedna z tych granic będzie bardziej ograniczająca niż druga.

Aby symetryczna unimodalna krzywa dzwonu wyśrodkowana w mieściła się w przedziale jednostkowym, jej połowa szerokości musi być mniejsza niż . pmin[p,1p]


Tak - ale druga granica będzie mniej ograniczająca! Dlaczego dwa efekty się nie anulują?
whuber

@ whuber Kłóciłem się z symetrią (tj. w prostym przypadku „dużego ” symetryczna krzywa dzwonowa musi pasować do przedziału, więc jej połowa szerokości jest ograniczona ściślejszą stroną, )nmin[p,1p]
GeoMatt22
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.