Interesuje mnie modelowanie danych odpowiedzi binarnej w sparowanych obserwacjach. Naszym celem jest wnioskowanie o skuteczności interwencji poprzedzającej post w grupie, potencjalnie dostosowując się do kilku zmiennych towarzyszących i ustalając, czy istnieje modyfikacja efektu przez grupę, która przeszła szczególnie różne szkolenie w ramach interwencji.
Biorąc pod uwagę dane o następującej formie:
id phase resp
1 pre 1
1 post 0
2 pre 0
2 post 0
3 pre 1
3 post 0
Oraz tablica zdarzeń informacji o sparowanej odpowiedzi:
Interesuje nas test hipotezy: .
Test McNemara daje: poniżejH0(asymptotycznie). Jest to intuicyjne, ponieważ poniżej wartości zerowej spodziewalibyśmy się, że równa część niezgodnych par (bic) będzie sprzyjać pozytywnemu efektowi ( ) lub negatywnemu efektowi ( c ). Przy zdefiniowanym prawdopodobieństwie pozytywnej definicji przypadku , an=b+c . Szanse na zaobserwowanie dodatniej niezgodnej pary wynoszą .
Z drugiej strony warunkowa regresja logistyczna wykorzystuje inne podejście do testowania tej samej hipotezy, maksymalizując prawdopodobieństwo warunkowe:
gdzie .
Jaki jest zatem związek między tymi testami? Jak wykonać prosty test tabeli awaryjności przedstawionej wcześniej? Patrząc na kalibrację wartości p z clogit i podejść McNemara poniżej zera, można by pomyśleć, że były one całkowicie niezwiązane!
library(survival)
n <- 100
do.one <- function(n) {
id <- rep(1:n, each=2)
ph <- rep(0:1, times=n)
rs <- rbinom(n*2, 1, 0.5)
c(
'pclogit' = coef(summary(clogit(rs ~ ph + strata(id))))[5],
'pmctest' = mcnemar.test(table(ph,rs))$p.value
)
}
out <- replicate(1000, do.one(n))
plot(t(out), main='Calibration plot of pvalues for McNemar and Clogit tests',
xlab='p-value McNemar', ylab='p-value conditional logistic regression')
exact2x2
mogą być referencjami.