Zawsze miałem wrażenie, że regresja jest po prostu bardziej ogólną formą ANOVA i że wyniki będą identyczne. Ostatnio jednak uruchomiłem zarówno regresję, jak i ANOVA dla tych samych danych, a wyniki różnią się znacznie. Oznacza to, że w modelu regresji zarówno główne efekty, jak i interakcja są znaczące, podczas gdy w ANOVA jeden główny efekt nie jest znaczący. Oczekuję, że ma to coś wspólnego z interakcją, ale nie jest dla mnie jasne, co różni się w tych dwóch sposobach modelowania tego samego pytania. Jeśli jest to ważne, jeden predyktor jest kategoryczny, a drugi ciągły, jak pokazano w poniższej symulacji.
Oto przykład tego, jak wyglądają moje dane i jakie analizy przeprowadzam, ale bez tych samych wartości p lub efektów, które są znaczące w wynikach (moje rzeczywiste wyniki są przedstawione powyżej):
group<-c(1,1,1,0,0,0)
moderator<-c(1,2,3,4,5,6)
score<-c(6,3,8,5,7,4)
summary(lm(score~group*moderator))
summary(aov(score~group*moderator))
group
jest wektorem numerycznym, czy jest to celowe? Zwykle czynniki grupujące powinny mieć klasę factor
, tak aby transformacja do kontrastów mogła być obsługiwana automatycznie przez funkcje takie jak lm()
. Stanie się to widoczne, gdy będziesz mieć więcej niż dwie grupy lub zastosujesz kodowanie inne niż 0/1 dla group
zmiennej.