Ogólny model liniowy pozwala nam napisać model ANOVA jako model regresji. Załóżmy, że mamy dwie grupy z dwiema obserwacjami, tj. Cztery obserwacje w wektorze . Zatem pierwotnym, nadparametryzowanym modelem jest E ( y ) = X ⋆ β ⋆ , gdzie X ⋆ jest macierzą predyktorów, tj. Zmiennych wskaźnikowych kodowanych obojętnie :
( μ 1 μ 1 μ 2 μ 2 ) = ( 1 1 0 1 1 0 1 0 1 1 0 1ymi( y) = X⋆β⋆X⋆
⎛⎝⎜⎜⎜μ1μ1μ2)μ2)⎞⎠⎟⎟⎟= ⎛⎝⎜⎜⎜111111000011⎞⎠⎟⎟⎟⎛⎝⎜β⋆0β⋆1β⋆2)⎞⎠⎟
Parametry nie są identyfikowalne jako ponieważ X ⋆ ma rangę 2 ( ( X ⋆ ) ′ X ⋆ nie jest odwracalna). Aby to zmienić, wprowadzamy ograniczenie β ⋆ 1 = 0 (kontrasty leczenia), co daje nam nowy model E ( y ) = X β :
(( ( X⋆)′X⋆)- 1( X⋆)′mi( y)X⋆( X⋆)′X⋆β⋆1= 0mi( y) = Xβ
⎛⎝⎜⎜⎜μ1μ1μ2)μ2)⎞⎠⎟⎟⎟= ⎛⎝⎜⎜⎜11110011⎞⎠⎟⎟⎟( β0β2))
μ1= β0β0μ2)= β0+ β2)β2)μ2)- μ1
tψ = ∑ cjotβjotψ0c = ( 0 , 1 )′β2)= 0μ2)- μ1= 0ψ^= ∑ cjotβ^jotβ^= ( X′X)- 1X′yψ
t = ψ^- ψ0σ^do′( X′X)- 1do---------√
‖e‖2Rnk(x)=2(X'X)-1X"=( 0,5 0,5 0 0 - 0,5 - 0,5 0,5 0,5 ) β 0=0,5σ^2)= ∥ e ∥2)/ (n- R a n k (X) )∥e∥2Rank(X)=2(X′X)−1X′=(.5−.5.5−.50.50.5)β^0=0.5y1+0.5y2=M1β^2=−0.5y1−0.5y2+0.5y3+0.5y4=M2−M1c′(X′X)−1c
t=M2−M1−0σ^=M2−M1∥e∥2/(n−2)−−−−−−−−−−√
t jest -dystrybucja z df (tutaj ). Kiedy kwadrat , otrzymujesz , statystyka testowa z testu ANOVA dla dwóch grup ( dla pomiędzy, dla wewnątrz grup), który następuje po - rozkład z 1 in df.tn−Rank(X)n−2tFbwFn-Rank(X)(M2−M1)2/1∥e∥2/(n−2)=SSb/dfbSSw/dfw=FFbwFn−Rank(X)
Przy więcej niż dwóch grupach hipoteza ANOVA (wszystkie mają jednocześnie 0, z ) odnosi się do więcej niż jednego parametru i nie może być wyrażona jako kombinacja liniowa , więc testy nie są równoważne . 1 ≤ j ψβj1≤jψ