Prawdopodobnie bardzo podstawowe pytanie dotyczące wieloczynnikowej ANOVA. Załóżmy dwustronny projekt, w którym testujemy zarówno główne efekty A, B, jak i interakcję A: B. Podczas testowania głównego efektu dla A z typem I SS, efekt SS jest obliczany jako różnica , gdzie jest sumą błędu resztkowego kwadratów dla modelu z tylko punktem przecięcia, oraz RSS dla modelu z dodanym współczynnikiem A. Moje pytanie dotyczy wyboru terminu błędu:R S S ( 1 ) R S S ( A )
W jaki sposób uzasadniasz, że wartość błędu dla tego testu jest zazwyczaj obliczana na podstawie danych RSS pełnego modelu A + B + A: B, który obejmuje zarówno główne efekty, jak i interakcję?
... w przeciwieństwie do wzięcia terminu błędu z nieograniczonego modelu z faktycznego porównania (RSS tylko z głównego efektu A w powyższym przypadku):
To robi różnicę, ponieważ termin błędu z pełnego modelu jest prawdopodobnie często (nie zawsze) mniejszy niż termin błędu z nieograniczonego modelu w porównaniu. Wydaje się, że wybór terminu błędu jest nieco arbitralny, tworząc miejsce na pożądane zmiany wartości p po prostu przez dodanie / usunięcie czynników, które tak naprawdę nie są interesujące, ale i tak zmienią termin błędu.
W poniższym przykładzie wartość F dla A zmienia się znacznie w zależności od wyboru pełnego modelu, mimo że rzeczywiste porównanie dla efektu SS pozostaje takie samo.
> DV <- c(41,43,50, 51,43,53,54,46, 45,55,56,60,58,62,62,
+ 56,47,45,46,49, 58,54,49,61,52,62, 59,55,68,63,
+ 43,56,48,46,47, 59,46,58,54, 55,69,63,56,62,67)
> IV1 <- factor(rep(1:3, c(3+5+7, 5+6+4, 5+4+6)))
> IV2 <- factor(rep(rep(1:3, 3), c(3,5,7, 5,6,4, 5,4,6)))
> anova(lm(DV ~ IV1)) # full model = unrestricted model (just A)
Df Sum Sq Mean Sq F value Pr(>F)
IV1 2 101.11 50.556 0.9342 0.4009
Residuals 42 2272.80 54.114
> anova(lm(DV ~ IV1 + IV2)) # full model = A+B
Df Sum Sq Mean Sq F value Pr(>F)
IV1 2 101.11 50.56 1.9833 0.1509
IV2 2 1253.19 626.59 24.5817 1.09e-07 ***
Residuals 40 1019.61 25.49
> anova(lm(DV ~ IV1 + IV2 + IV1:IV2)) # full model = A+B+A:B
Df Sum Sq Mean Sq F value Pr(>F)
IV1 2 101.11 50.56 1.8102 0.1782
IV2 2 1253.19 626.59 22.4357 4.711e-07 ***
IV1:IV2 4 14.19 3.55 0.1270 0.9717
Residuals 36 1005.42 27.93
To samo pytanie dotyczy SS typu II i ogólnie ogólnej hipotezy liniowej, tj. Porównania modelu między modelem ograniczonym i nieograniczonym w pełnym modelu. (W przypadku SS typu III nieograniczonym modelem jest zawsze pełny model, więc nie pojawia się tam pytanie)
IV1
(pierwszy przykład), wówczas dwa wyrażenia dla mianownika są identyczne. Jednak gdy pełny model zawiera dodatkowe efekty, mianownik do testowania zmienia się, mimo że porównanie modelu (w porównaniu do typu 1 SS) nie zmienia się. W 3 przykładach średni kwadrat dla nie zmienia się (porównanie tego samego modelu we wszystkich przypadkach), ale średni błąd kwadratowy zmienia się. Interesuje mnie, co uzasadnia zmianę terminu błędu, gdy rzeczywiste porównanie pozostaje takie samo. A~ 1
~ IV1 + 1
anova(lm(DV ~ IV1))
anova(lm(DV ~ 1))
anova(lm(DV ~ IV1))