Jestem zainteresowany oszacowaniem skorygowanego współczynnika ryzyka, analogicznie do tego, jak szacuje się skorygowany iloraz szans za pomocą regresji logistycznej. Niektóre piśmiennictwo (np. To ) wskazuje, że użycie regresji Poissona ze standardowymi błędami Hubera-White'a jest metodą modelową, aby to zrobić
Nie znalazłem literatury na temat tego, jak wpływa to na ciągłe zmienne towarzyszące. Poniższa prosta symulacja pokazuje, że ten problem nie jest tak prosty:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
W takim przypadku rzeczywisty współczynnik ryzyka wynosi 2, który odzyskuje się niezawodnie, gdy efekt zmiennej jest niewielki. Ale gdy efekt kowariancji jest duży, zostaje on zniekształcony. Zakładam, że wynika to z faktu, że efekt kowariancji może przesunąć się w górę w stosunku do górnej granicy (1) i to zanieczyszcza oszacowanie.
Szukałem, ale nie znalazłem żadnej literatury na temat korygowania ciągłych zmiennych towarzyszących w oszacowaniu skorygowanego współczynnika ryzyka. Jestem świadomy następujących postów na tej stronie:
- Regresja Poissona w celu oszacowania względnego ryzyka wyników binarnych
- Regresja Poissona dla danych binarnych
ale nie odpowiadają na moje pytanie. Czy są na to jakieś dokumenty? Czy są jakieś znane przestrogi, które należy zastosować?