Nie używaj normalnego przybliżenia
Wiele napisano o tym problemie. Ogólnie zaleca się, aby nigdy nie stosować normalnego przybliżenia (tj. Przedziału ufności asymptotycznego / Walda), ponieważ ma on straszne właściwości pokrycia. Kod R ilustrujący to:
library(binom)
p = seq(0,1,.001)
coverage = binom.coverage(p, 25, method="asymptotic")$coverage
plot(p, coverage, type="l")
binom.confint(0,25)
abline(h=.95, col="red")
W przypadku małych prawdopodobieństw sukcesu możesz poprosić o 95% przedział ufności, ale tak naprawdę, powiedzmy, 10% przedział ufności!
Rekomendacje
Czego więc powinniśmy użyć? Uważam, że obecne zalecenia są wymienione w artykule Interval Estimation for a Binomial Proportion autorstwa Browna, Cai i DasGupta in Statistics Science 2001, vol. 16, nr 2, strony 101–133. Autorzy zbadali kilka metod obliczania przedziałów ufności i doszli do następującego wniosku.
[W] Zalecamy przedział Wilsona lub równy wcześniej Jeffreys dla przedziału dla małych n, a przedział sugerowany w Agresti i Coull dla większych n .
Interwał Wilsona jest czasem nazywany także interwałem oceny , ponieważ opiera się na odwróceniu testu oceny.
Obliczanie przedziałów
Aby obliczyć te przedziały ufności, możesz użyć tego kalkulatora online lub binom.confint()
funkcji w binom
pakiecie w R. Na przykład, dla 0 sukcesów w 25 próbach, kod R byłby:
> binom.confint(0, 25, method=c("wilson", "bayes", "agresti-coull"),
type="central")
method x n mean lower upper
1 agresti-coull 0 25 0.000 -0.024 0.158
2 bayes 0 25 0.019 0.000 0.073
3 wilson 0 25 0.000 0.000 0.133
Oto bayes
interwał Jeffreysa. (Argument type="central"
jest potrzebny, aby uzyskać przedział równości .)
Pamiętaj, że powinieneś zdecydować, której z trzech metod chcesz użyć przed obliczeniem interwału. Patrząc na wszystkie trzy i wybierając najkrótsze, naturalnie otrzymasz zbyt małe prawdopodobieństwo pokrycia.
Szybka, przybliżona odpowiedź
Na koniec, jeśli zaobserwujesz dokładnie zero sukcesów w swoich n próbach i po prostu chcesz bardzo szybkiego przybliżonego przedziału ufności, możesz zastosować zasadę trzech . Po prostu podziel liczbę 3 przez n . W powyższym przykładzie n wynosi 25, więc górna granica wynosi 3/25 = 0,12 (dolna granica to oczywiście 0).