Jest to bardziej pytanie koncepcyjne, ale w miarę używania R
będę odwoływał się do pakietów w R
. Jeśli celem jest dopasowanie modelu liniowego do celów przewidywania, a następnie dokonanie prognoz, w których efekty losowe mogą być niedostępne, czy jest jakaś korzyść ze stosowania modelu efektów mieszanych, czy zamiast tego należy zastosować model efektu stałego?
Na przykład, jeśli posiada dane dotyczące masy ciała w porównaniu z wysokością innej informacji, a zbudować stosując następujący wzór lme4
, w którym przedmiot jest elementem z poziomów ( )
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
Następnie chcę być w stanie przewidzieć wagę na podstawie modelu na podstawie nowych danych dotyczących wzrostu i wieku. Oczywiście wariancja oryginalnych danych według tematu jest rejestrowana w modelu, ale czy można wykorzystać te informacje w prognozie? Powiedzmy, że mam nowe dane dotyczące wzrostu i wieku i chcę przewidzieć wagę, mogę to zrobić w następujący sposób:
predict(mod1,newdata=newdf) # newdf columns for height, age, subject
To wykorzysta predict.merMod
i mogę albo dołączyć kolumnę (nowych) tematów do newdf
, albo ustawić re.form =~0
. Po pierwsze, nie jest jasne, co robi model z „nowymi” czynnikami podmiotowymi, a po drugie, czy wariancja według podmiotu uchwycona w modelu zostanie po prostu zignorowana (uśredniona) dla prognozy?
W obu przypadkach wydaje mi się, że bardziej odpowiedni może być model liniowy o stałym efekcie. Rzeczywiście, jeśli moje rozumowanie jest poprawne, to model z efektem stałym powinien przewidywać te same wartości, co model mieszany, jeśli efekt losowy nie jest używany w przewidywaniu. Czy tak powinno być? W R
tym nie ma na przykład:
mod1 <- lmer(weight ~ height + age + (1|subject), data=df, REML=F)
predict(mod1,newdata=newdf, re.form=~0) # newdf columns for height, age, subject
daje różne wyniki do:
mod2 <- lm(weight ~ height + age, data=df)
predict(mod2,newdata=newdf) # newdf columns for height, age