Jeśli wykonujesz jednokierunkową analizę ANOVA, aby sprawdzić, czy istnieje znacząca różnica między grupami, to domyślnie porównujesz dwa modele zagnieżdżone (więc istnieje tylko jeden poziom zagnieżdżenia, ale nadal jest zagnieżdżany).
Te dwa modele to:
- Model 0: Wartości (gdzie to numer próbki, a to numer grupy) są modelowane przez oszacowaną średnią całej próbki.
yI jjajotβ^0
yI j= β^0+ ϵja
Model 1: Wartości są modelowane za pomocą oszacowanych średnich grup.
(a jeśli reprezentujemy model między odmianami grup,
, wówczas model 0 jest zagnieżdżony w modelu 1)βjot^
yja= β^0+ β^jot+ ϵja
Przykład porównania średnich i równoważności z modelami zagnieżdżonymi: weźmy długość sepal (cm) ze zbioru danych tęczówki (jeśli użyjemy wszystkich czterech zmiennych, moglibyśmy faktycznie wykonywać LDA lub MANOVA tak jak Fisher w 1936 r.)
Obserwowane średnie całkowite i grupowe to:
μt o t a lμs e t o s aμv e r s i c o l o rμv i r gi n i c= 5,83= 5,01= 5,94= 6,59
Który jest w formie modelu:
model 1: model 2: yI j= 5,83 + ϵjayI j= 5,01 + ⎡⎣⎢00,931,58⎤⎦⎥jot+ ϵja
we wzorze 1 oznacza sumy kwadratów .∑ ϵ2)ja= 102,1663
we wzorze 2 oznacza w grupie sumy kwadratów .∑ ϵ2)ja= 38,9562
Tabela ANOVA będzie podobna (i domyślnie obliczy różnicę, która jest między sumą kwadratów grupy, która wynosi 63,212 w tabeli o 2 stopniach swobody):
> model1 <- lm(Sepal.Length ~ 1 + Species, data=iris)
> model0 <- lm(Sepal.Length ~ 1, data=iris)
> anova(model0, model1)
Analysis of Variance Table
Model 1: Sepal.Length ~ 1
Model 2: Sepal.Length ~ 1 + Species
Res.Df RSS Df Sum of Sq F Pr(>F)
1 149 102.168
2 147 38.956 2 63.212 119.26 < 2.2e-16 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
z
fa= R SS.rei ffae r e n c eD F.rei ffae r e n c eR SS.n e wD F.n e w= 63,2122)38,956147= 119,26
zestaw danych użyty w przykładzie:
długość płatka (cm) dla trzech różnych gatunków kwiatów tęczówki
Iris setosa Iris versicolor Iris virginica
5.1 7.0 6.3
4.9 6.4 5.8
4.7 6.9 7.1
4.6 5.5 6.3
5.0 6.5 6.5
5.4 5.7 7.6
4.6 6.3 4.9
5.0 4.9 7.3
4.4 6.6 6.7
4.9 5.2 7.2
5.4 5.0 6.5
4.8 5.9 6.4
4.8 6.0 6.8
4.3 6.1 5.7
5.8 5.6 5.8
5.7 6.7 6.4
5.4 5.6 6.5
5.1 5.8 7.7
5.7 6.2 7.7
5.1 5.6 6.0
5.4 5.9 6.9
5.1 6.1 5.6
4.6 6.3 7.7
5.1 6.1 6.3
4.8 6.4 6.7
5.0 6.6 7.2
5.0 6.8 6.2
5.2 6.7 6.1
5.2 6.0 6.4
4.7 5.7 7.2
4.8 5.5 7.4
5.4 5.5 7.9
5.2 5.8 6.4
5.5 6.0 6.3
4.9 5.4 6.1
5.0 6.0 7.7
5.5 6.7 6.3
4.9 6.3 6.4
4.4 5.6 6.0
5.1 5.5 6.9
5.0 5.5 6.7
4.5 6.1 6.9
4.4 5.8 5.8
5.0 5.0 6.8
5.1 5.6 6.7
4.8 5.7 6.7
5.1 5.7 6.3
4.6 6.2 6.5
5.3 5.1 6.2
5.0 5.7 5.9
anova()
funkcja, ponieważ pierwsza, prawdziwa ANOVA również używa testu F. Prowadzi to do nieporozumień terminologicznych.