Jak w wyborach możemy stwierdzić, że kandydat zostanie zwycięzcą?

Wczoraj mieszkam w wyborach powszechnych, a sieć telewizyjna zaczęła wzywać zwycięzców na długo przed otwarciem wszystkich kart do głosowania.

Okazały się słuszne na wszystkich kontach i nie jestem zaskoczony, że tak zrobili. Wiem, że statystyki są absolutnie wykonalne. Mimo to jestem ciekawa. Zarozumiały:

mamy otwarte $i$ z głosowaniach; $j$
mamy kandydatów, których bieżące wyniki to ; $n$ $c_1, c_2, c_3, ... c_n$

Jak obliczyć pewność, z jaką wiodący kandydat jest zwycięzcą?

elections

— skradać się
źródło

Pamiętaj, że zazwyczaj mają dostęp do obszernych danych z odpytywania przy wyjściu oraz innych danych, których mogą użyć do przewidywania wyniku. Potrzebują tylko wystarczającego potwierdzenia z przychodzącej liczby, aby upewnić się, że nie są wyłączone z powodu błędu próbkowania. Z pewnością wiąże się to ze złożonością, a liczby przychodzące są na ogół stronniczą próbą, ale wyniki ankiet są bardzo pomocne w rozwiązaniu niektórych z tych problemów.

— gung - Przywróć Monikę

Jeśli „z pewnością” ma być rozumiane dosłownie, statystyki nie mogą (prawie?) Nigdy odpowiedzieć na pytanie „z pewnością”. Ale możemy udzielić odpowiedzi z dużym przekonaniem, że odpowiedź będzie poprawna. (Innymi słowy, jeśli otrzymamy nasze dane i wykonamy nasze analizy poprawnie, możemy powiedzieć: „Moja odpowiedź będzie błędna tylko w x% przypadków.”)

— Emil Friedman

Odpowiedzi:

Główną trudnością w praktyce nie jest niepewność statystyczna, że przypadek szczęścia dałby jednemu kandydatowi więcej głosów. Główną trudnością, rzędu wielkości lub większej, jest to, że otwarte karty do głosowania prawie nigdy nie są obiektywną próbą oddanych głosów. Jeśli zignorujesz ten efekt, otrzymasz słynny błąd „Dewey pokonuje Trumana”, który wystąpił w przypadku dużej, stronniczej próbki.

W praktyce wyborcy, którzy faworyzują jednego kandydata w stosunku do drugiego, nie są równo podzieleni według regionu, ze względu na to, czy pracują w ciągu dnia, czy przez to, czy zostaną rozmieszczeni za granicą, dlatego głosują za pomocą nieobecnych kart. To nie są małe różnice.

Myślę, że teraz organizacje informacyjne dzielą populację na grupy i wykorzystują wyniki do oszacowania, jak głosowała każda grupa (w tym frekwencja). Mogą być one oparte na modelach i wcześniejszych założeniach opartych na poprzednich wyborach, a nie tylko na danych z tych wyborów. Nie mogą one uwzględniać osobliwości, takich jak karty do głosowania w Palm Beach.

— Douglas Zare
źródło

W Australii do około 10-15 lat temu partie konserwatywne zwykle zaczynały silnie na początku, a partie progresywne wracały późno. Sieci telewizyjne zapewne wiedziały, co się dzieje, ale ta zmienność prawdopodobnie przyczyniła się do zwiększenia dramatyzmu. Wszystko zmieniło się, gdy analityk Antony Green zaczął używać stoiska według wyników, aby wyjaśnić fakt, że małe kabiny na obszarach wiejskich mają tendencję do wcześniejszego liczenia i wyników, a głosują bardziej zachowawczo. Antony słusznie nazwał wynik wyborów godzinami, zanim ktokolwiek użyje tego.

— Bogdanovist

Wyniki z kabiny z kabiny z poprzednich lat można wykorzystać do bardzo dokładnej kalibracji szacunków całkowitego wyniku.

— Peter Ellis,

@DouglasZare Myślę, że masz na myśli to, że aktualnie otwarte karty do głosowania nie są przypadkową próbą.

— Michael R. Chernick,

@Michael Chernick: Jaka jest różnica między próbką nielosową a próbą stronniczą? en.wikipedia.org/wiki/Sampling_bias wydaje się używać ich jako synonimów.

— Douglas Zare

@DouglasZare Widzę z twojego linku, że wikipedia używa stronniczej próbki jako synonimu nieprzypadkowego. Myślę, że to zły wybór. Odchylenie ogólne odnosi się do oczekiwania, że estymator nie będzie równy prawdziwej wartości parametru. W kontekście pobierania próbek próba nieprzypadkowa nie oznacza stronniczości dla konkretnego oszacowania. Może, ale nie musi, prowadzić do stronniczości.

— Michael R. Chernick,

Podczas pobierania próbek w ankiecie potrzebny jest błąd standardowy oszacowania proporcji. To zależy bardziej od i niż j. Wymaga to również, aby i otwarte karty do głosowania były wybierane losowo. Jeśli p jest prawdziwą proporcją końcową dla kandydata A, wówczas wariancja oszacowania wynosi

\frac{(1 - \frac{i}{j}) p (1 - p)}{i}

$\frac{(1-\frac{i}{j})p(1-p)}{i}$

$(1-\frac{i}{j})$ nazywa się skończonym współczynnikiem korygującym populację. Aby oszacować tę wariancję, zwykłe oszacowanie p zastępuje się p we wzorze. Standardowy błąd uzyskuje się, biorąc pierwiastek kwadratowy. Przewidując zwycięzcę ankieter może użyć oszacowania plus lub minus 3 błędy standardowe. Jeśli w przedziale czasowym nie ma 0,5, wówczas kandydat A zostaje ogłoszony zwycięzcą, jeśli 0,5 jest poniżej dolnego limitu, lub jego przeciwnik zostaje ogłoszony zwycięzcą, jeśli 0,5 jest powyżej górnego limitu. Oczywiście mówi to tylko z bardzo dużą pewnością, kto zwycięży w przypadku, gdy 0,5 będzie poza przedziałem czasowym. Poziom ufności wynosi 0,99, jeśli używasz trzech standardowych błędów (w oparciu o normalne przybliżenie do dwumianu). Jeśli w przedziale znajduje się 0,5, nikt nie zostaje ogłoszony zwycięzcą, a ankieter czeka na zgromadzenie większej ilości danych.

Dokonując projekcji, ankieterzy mogą wybrać losową próbę warstwową ze skumulowanych głosów, aby uniknąć potencjalnego błędu, który może wystąpić, jeśli spojrzy się na wszystkie zliczone głosy. Problem z oglądaniem wszystkich zgromadzonych głosów polega na tym, że niektóre obwody całkowicie liczą się nad innymi i mogą nie być reprezentatywne dla populacji.

Artykuł tutaj zapewnia dobre omówienie problemu i liczne odniesienia.

Zwrócono uwagę, że skumulowane głosy mogą dostarczyć stronnicze oszacowania proporcji, ponieważ albo posterunki, które jeszcze się nie zgłosiły, są posterunkami, które mają tendencję do faworyzowania partii z kandydatem, który jest wleczony, lub kartami do głosowania nieobecnych prawdopodobnie faworyzują kandydata, który jest wleczony i te głosy są liczone jako ostatnie. Wyrafinowani ankieterzy, tacy jak Harris i Gallup, nie wpadają w takie pułapki. Prosta analiza konstruowania przedziałów ufności w oparciu o skumulowane głosy, które nakreśliłam, jest tylko jednym z czynników, który jest stosowany. Ankieterzy mają do dyspozycji znacznie więcej informacji. Mają ankiety, które zostały przeprowadzone na krótko przed wyborami, i mają wzorce głosowania we wszystkich dzielnicach i nieobecne głosy z wyborów w ostatnich latach.

Jeśli więc istnieją wyraźne uprzedzenia, które mogłyby zamykać bliskie wybory w przeciwnym kierunku, ankieterzy to rozpoznają i wstrzymają się z projekcją zwycięzcy.

W Stanach Zjednoczonych karty do głosowania nieobecnych pochodzą głównie od zagranicznych wojskowych i studentów, którzy są w szkole poza domem. Podczas gdy wojsko może być bardziej konserwatywne i może głosować na republikanów, koledzy są bardziej liberalni i mogą głosować na Demokratów. Wszystkie te względy są brane pod uwagę.

Troska i wyrafinowanie współczesnego sondowania powoduje, że od tego czasu nie wystąpiły rażące błędy, takie jak sondaż literacki z 1936 r. Lub przedwczesne ustępstwa gazety z Chicago w wyborach z 1948 r. Do Dewey.

— Michael R. Chernick
źródło

Chociaż domniemana analogia z próbkowaniem ankietowym jest trafna, czy to pytanie nie dodaje czynników komplikujących? Pierwszą jest możliwość, że więcej niż dwóch kandydatów. Po drugie, jest to sekwencyjny problem decyzyjny: w przeciwieństwie do ankietera, który zazwyczaj określa rozmiar ankiety i podejmuje jedną decyzję na podstawie próbki, w każdym momencie sieć ma rosnącą próbkę i musi zdecydować, czy zwołać wybory, czy poczekać więcej informacji. Przytoczone tutaj aplikacje ankietowe nie wydają się mieć zastosowania do tej dynamicznej sytuacji. I dlaczego sieć miałaby używać 3 SE? (Stawką jest jego reputacja.)

— whuber

@ whuber Zgadzam się, że istnieją komplikacje, które prawdopodobnie nie są brane pod uwagę w praktyce. Dla uproszczenia wybrałem przypadek dwóch kandydatów, w którym większość to wygrana. Myślę, że taką sytuację miał na myśli PO. Zwycięstwo z wieloma lub trzema kandydatami wymagałoby wykazania, że „zwycięski kandydat miał wyższy odsetek niż jego przeciwnicy. Z pewnością, jeśli przeprowadzisz ankietę więcej niż raz, należy wziąć pod uwagę sekwencyjny charakter próbkowania. Nie jestem pewien, czy to jest

— Michael R. Chernick,

Wybrałem 3 SE, ponieważ uważam, że ankieterzy chcą „być bardzo pewni”, że mają rację przed ogłoszeniem zwycięzcy. Dlatego myślę, że 3 byłoby użyte zamiast 2. Jeśli chcesz jeszcze mniejszego ryzyka błędu, możesz przekroczyć 3. Użyłem wzoru standardowego błędu, aby dać PO pojęcie, w jaki sposób poziom pewności zależy od i j w prosty sposób. Skomplikowanie sytuacji spowodowałoby, że wynik byłby bardziej skomplikowany, a zależność I i j nie byłaby tak wyraźnie widoczna.

— Michael R. Chernick,

n

$n$

2

$2$

Skoro dostaję kilka głosów negatywnych, czy ktoś wyjaśniłby to uzasadnienie?

— Michael R. Chernick,