Różne opisy wyboru modeli losowych efektów liniowych modeli mieszanych instruują użycie REML. Znam różnicę między REML i ML na pewnym poziomie, ale nie rozumiem, dlaczego REML powinien być używany, ponieważ ML jest stronniczy. Na przykład, czy błędem jest przeprowadzanie LRT na parametrze wariancji normalnego modelu dystrybucji przy użyciu ML (patrz kod poniżej)? Nie rozumiem, dlaczego ważniejsze jest bycie obiektywnym niż ML w wyborze modelu. Myślę, że ostateczną odpowiedzią musi być „ponieważ wybór modelu działa lepiej z REML niż z ML”, ale chciałbym wiedzieć coś więcej. Nie przeczytałem pochodnych LRT i AIC (nie jestem wystarczająco dobry, aby je dokładnie zrozumieć), ale jeśli REML jest wyraźnie użyty w pochodnych, po prostu wiedząc, że to będzie w rzeczywistości wystarczające (np.
n <- 100
a <- 10
b <- 1
alpha <- 5
beta <- 1
x <- runif(n,0,10)
y <- rnorm(n,a+b*x,alpha+beta*x)
loglik1 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
-sum(dnorm(y,a+b*x,alpha,log=T))
}
loglik2 <- function(p,x,y){
a <- p[1]
b <- p[2]
alpha <- p[3]
beta <- p[4]
-sum(dnorm(y,a+b*x,alpha+beta*x,log=T))
}
m1 <- optim(c(a,b,alpha),loglik1,x=x,y=y)$value
m2 <- optim(c(a,b,alpha,beta),loglik2,x=x,y=y)$value
D <- 2*(m1-m2)
1-pchisq(D,df=1) # p-value