Potrzebujesz testu McNemara ( http://en.wikipedia.org/wiki/McNemar%27s_test , http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3346204/ ). Oto przykład:
Zbadano 1300 pkt. I 1300 dopasowanych kontroli. Status palenia przedstawiono następująco:
Normal
|no |yes|
Cancer|No |1000|40 |
|Yes |200 |60 |
Każdy wpis w tabeli pokazuje informacje o PARIE KONTROLI SPRAWY: 1000 oznacza w 1000 parach kontroli przypadków, żadna z nich nie była palaczem. 40 to liczba par kontrolnych przypadków, w których kontrola była palaczem, a pacjent z rakiem nie, i tak dalej. Poniższy kod R można wykorzystać do wygenerowania tej tabeli i wykonania testu McNemara.
mat = as.table(rbind(c(1000, 40), c( 200, 60) ))
colnames(mat) <- rownames(mat) <- c("Nonsmoker", "Smoker")
names(dimnames(mat)) = c("Cancer", "Normal")
mat
# Normal
# Nonsmoker Smoker
# Cancer
# Nonsmoker 1000 40
# Smoker 200 60
mcnemar.test(mat)
# McNemar's Chi-squared test with continuity correction
#
#data: mat
#McNemar's chi-squared = 105.34, df = 1, p-value < 2.2e-16
Test McNemara służy również do oceny wpływu interwencji na binarną zmienną wyniku. Para wyników przed-po jest przedstawiona i przetestowana jak wyżej.
Edycja: Rozszerzając przykład podany przez @gung, jeśli status palenia jest wymieniony w ramce danych mydf w następujący sposób:
pairID cancer control
1 1 1
2 1 1
3 1 0
...
Test McNemars można wykonać za pomocą następujących poleceń R:
> tt = with(mydf, table(cancer, control))
> tt
control
cancer 0 1
0 5 1
1 3 2
> mcnemar.test(tt)
McNemar`s Chi-squared test with continuity correction
data: tt
McNemar`s chi-squared = 0.25, df = 1, p-value = 0.6171