Próbuję rozwiązać następujące pytanie:
Gracz A wygrał 17 z 25 gier, podczas gdy gracz B wygrał 8 z 20 - czy istnieje znacząca różnica między obydwoma współczynnikami?
Co przychodzi na myśl w R, to:
> prop.test(c(17,8),c(25,20),correct=FALSE)
2-sample test for equality of proportions without continuity correction
data: c(17, 8) out of c(25, 20)
X-squared = 3.528, df = 1, p-value = 0.06034
alternative hypothesis: two.sided
95 percent confidence interval:
-0.002016956 0.562016956
sample estimates:
prop 1 prop 2
0.68 0.40
Ten test mówi, że różnica nie jest znacząca na poziomie ufności 95%.
Ponieważ wiemy, że prop.test()
używa się tylko przybliżenia, chcę uściślić wszystko za pomocą dokładnego testu dwumianowego - i robię to w obie strony:
> binom.test(x=17,n=25,p=8/20)
Exact binomial test
data: 17 and 25
number of successes = 17, number of trials = 25, p-value = 0.006693
alternative hypothesis: true probability of success is not equal to 0.4
95 percent confidence interval:
0.4649993 0.8505046
sample estimates:
probability of success
0.68
> binom.test(x=8,n=20,p=17/25)
Exact binomial test
data: 8 and 20
number of successes = 8, number of trials = 20, p-value = 0.01377
alternative hypothesis: true probability of success is not equal to 0.68
95 percent confidence interval:
0.1911901 0.6394574
sample estimates:
probability of success
0.4
To dziwne, prawda? Wartości p są za każdym razem zupełnie inne! W obu przypadkach wyniki są (bardzo) znaczące, ale wartości p wydają się przeskakiwać raczej przypadkowo.
Moje pytania
- Dlaczego wartości p , że za każdym razem inny?
- Jak poprawnie wykonać dokładnie dwumianowy test dwóch proporcji próbki w R?
prop.test
vschisq.test
), w tym pytaniu znajduje się ta sama podstawowa koncepcja . Przeprowadzasz trzy różne testy z różnymi „hipotezami zerowymi” w każdym z trzech przykładów.