Zawsze miałem wrażenie, że regresja jest po prostu bardziej ogólną formą ANOVA i że wyniki będą identyczne. Ostatnio jednak uruchomiłem zarówno regresję, jak i ANOVA dla tych samych danych, a wyniki różnią się znacznie. Oznacza to, że w modelu regresji zarówno główne efekty, jak i interakcja są znaczące, podczas gdy w ANOVA jeden główny efekt nie jest znaczący. Oczekuję, że ma to coś wspólnego z interakcją, ale nie jest dla mnie jasne, co różni się w tych dwóch sposobach modelowania tego samego pytania. Jeśli jest to ważne, jeden predyktor jest kategoryczny, a drugi ciągły, jak pokazano w poniższej symulacji.
Oto przykład tego, jak wyglądają moje dane i jakie analizy przeprowadzam, ale bez tych samych wartości p lub efektów, które są znaczące w wynikach (moje rzeczywiste wyniki są przedstawione powyżej):
group<-c(1,1,1,0,0,0)
moderator<-c(1,2,3,4,5,6)
score<-c(6,3,8,5,7,4)
summary(lm(score~group*moderator))
summary(aov(score~group*moderator))
groupjest wektorem numerycznym, czy jest to celowe? Zwykle czynniki grupujące powinny mieć klasę factor, tak aby transformacja do kontrastów mogła być obsługiwana automatycznie przez funkcje takie jak lm(). Stanie się to widoczne, gdy będziesz mieć więcej niż dwie grupy lub zastosujesz kodowanie inne niż 0/1 dla groupzmiennej.