Na pierwszym poziomie myślę, że ignorujecie kurczenie się w kierunku wartości populacji; „ nachylenia i przechwyty dla poszczególnych podmiotów z modelu efektów mieszanych są bliższe oszacowaniom populacji niż szacunki najmniejszych kwadratów w obrębie podmiotu. ” [ref. 1]. Poniższy link prawdopodobnie również będzie pomocny ( jakie są odpowiednie opisy, aby szukać moich modeli mieszanych? ), Patrz odpowiedź Mike Lawrence).
Co więcej, myślę, że masz mało szczęścia w przykładzie z zabawką, ponieważ masz idealnie zrównoważony projekt, który powoduje, że masz dokładnie takie same oszacowanie w przypadku braku brakujących wartości.
Wypróbuj następujący kod, który ma ten sam proces bez brakującej wartości:
cat <- as.factor(sample(1:5, n*k, replace=T) ) #This should be a bit unbalanced.
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits= 7,fixef(m3)) == round(digits=7, coef(m1)) #Not this time lad.
#(Intercept) x
# FALSE FALSE
Gdzie teraz, ponieważ twój projekt nie jest idealnie zrównoważony, nie masz takich samych oszacowań współczynników.
W rzeczywistości, jeśli grasz w zgubny wzór wartości w głupi sposób (na przykład:), y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
więc twój projekt jest nadal idealnie zrównoważony, otrzymasz znowu te same współczynniki.
require(nlme)
set.seed(128)
n <- 100
k <- 5
cat <- as.factor(rep(1:k, each = n))
cat_i <- 1:k # intercept per kategorie
x <- rep(1:n, k)
sigma <- 0.2
alpha <- 0.001
y <- cat_i[cat] + alpha * x + rnorm(n*k, 0, sigma)
plot(x, y)
# simulate missing data in a perfectly balanced way
y[ c(1:10, 100 + 1:10, 200 + 1:10, 300 + 1:10, 400 +1:10)] <- NA
m1 <- lm(y ~ x)
m3 <- lme(y ~ x, random = ~ 1|cat, na.action = na.omit)
round(digits=7,fixef(m3)) == round(digits=7, coef(m1)) #Look what happend now...
#(Intercept) x
# TRUE TRUE
Nieznacznie wprawia Cię w błąd idealny projekt oryginalnego eksperymentu. Po włożeniu NA w sposób niezrównoważony zmieniłeś wzór „siły”, jaką poszczególne osoby mogły pożyczyć od siebie.
Krótko mówiąc, różnice, które widzisz, są spowodowane efektami skurczu, a konkretnie dlatego, że zniekształciłeś swój pierwotnie idealnie zrównoważony projekt z niedokładnie zrównoważonymi brakującymi wartościami.
Ref 1: Douglas Bates lme4: Modelowanie efektów mieszanych z R , strony 71-72
m3
to 0,0011713” zamiastm2
.