Co to jest matryca kontrastowa?


46

Czym dokładnie jest matryca kontrastu (termin odnoszący się do analizy z predyktorami jakościowymi) i jak dokładnie określono matrycę kontrastu? Tzn. Czym są kolumny, czym są wiersze, jakie są ograniczenia na tej macierzy i co oznacza liczba w kolumnie ji rzędzie i? Próbowałem przeglądać dokumenty i sieć, ale wygląda na to, że wszyscy go używają, ale nigdzie nie ma definicji. Mógłbym wstecz opracować dostępne wcześniej zdefiniowane kontrasty, ale myślę, że definicja powinna być dostępna bez tego.

> contr.treatment(4)
  2 3 4
1 0 0 0
2 1 0 0
3 0 1 0
4 0 0 1
> contr.sum(4)
  [,1] [,2] [,3]
1    1    0    0
2    0    1    0
3    0    0    1
4   -1   -1   -1
> contr.helmert(4)
  [,1] [,2] [,3]
1   -1   -1   -1
2    1   -1   -1
3    0    2   -1
4    0    0    3
> contr.SAS(4)
  1 2 3
1 1 0 0
2 0 1 0
3 0 0 1
4 0 0 0

„Matryca kontrastu” jest używana do reprezentowania jakościowych IV (czynników) w modelowaniu. W szczególności służy do przekodowania współczynnika na zbiór „zmiennych kontrastowych” (zmienne fikcyjne są tylko przykładem). Każdy typ zmiennych kontrastu ma swoją własną macierz kontrastu. Zobacz na przykład moje własne powiązane pytanie , na które jeszcze nie ma odpowiedzi.
ttnphns,

5
@ttnphns Przepraszamy, ale nadal robisz to, co robią wszystkie dokumenty i strony internetowe: wyjaśniasz, do czego służą matryce kontrastowe, nie zajmując się pytaniem, co to jest matryca kontrastowa. To jest cel definicji .
Ciekawy

3
Oczywiście jest to powiązane, ale wyprowadzanie „tego, czym jest” z „tego, do czego jest to potrzebne” to praca detektywa, która nie powinna być potrzebna. To inżynieria odwrotna. Rzeczy powinny być udokumentowane.
Ciekawy

2
ats.ucla.edu/stat/r/library/contrast_coding.htm jest dobrze Rzorientowanym zasobem na temat metod kodowania.
whuber

1
@Curious, żeby Cię poinformować: przyznałem 100 nagród za ttnphns, ale zacznę kolejną nagrodę (lub poproszę o to kogoś innego), aby przyznać także Gus_est. Napisałem również własną odpowiedź, na wypadek, gdybyś wolał mieć krótszą :-)
ameba mówi Przywróć Monikę

Odpowiedzi:


31

W swojej miłej odpowiedzi, @Gus_est, podjął matematyczne wyjaśnienie istoty macierzy współczynnika kontrastu L (zapisanej tam C ). jest podstawową formułą do testowania hipotez w jednoczynnikowym ogólnym modelowaniu liniowym (gdzie są parametrami, a to przewidywalna funkcja reprezentująca hipotezę zerową), a ta odpowiedź pokazuje niektóre niezbędne formuły stosowane we współczesnych programach ANOVA.b kLb=kbk

Moja odpowiedź ma inny styl. To jest dla analityka danych, który widzi siebie raczej jako „inżyniera” niż „matematyka”, więc odpowiedzią będzie (powierzchowne) konto „praktyczne” lub „dydaktyczne” i skupi się na odpowiedzi tylko na tematy (1), co robi Współczynniki kontrastu oznaczają i (2) w jaki sposób mogą pomóc w wykonaniu ANOVA za pomocą programu regresji liniowej .

ANOVA jako regresja ze zmiennymi fikcyjnymi: wprowadzanie kontrastów .

Wyobraźmy sobie ANOVA ze zmienną zależną Y i kategorycznym współczynnikiem A posiadającym 3 poziomy (grupy). Rzućmy okiem na ANOVA z punktu widzenia regresji liniowej, to znaczy - poprzez przekształcenie współczynnika w zbiór obojętnych (aka wskaźnik aka leczenie aka one-hot ) zmiennych binarnych. To jest nasz niezależny zestaw X . (Prawdopodobnie wszyscy słyszeli, że ANOVA można wykonać w ten sposób - jako regresję liniową z obojętnymi predyktorami).

Ponieważ jedna z trzech grup jest zbędna, tylko dwie zmienne zastępcze wejdą do modelu liniowego. Wyznaczmy Grupę 3 jako zbędną lub referencyjną. Atrapy predyktory tworzące X są przykładem zmiennych kontrastu , tj. Zmiennych elementarnych reprezentujących kategorie czynnika. Sam X jest często nazywany macierzą projektową. Możemy teraz wprowadzić zestaw danych w programie wielokrotnej regresji liniowej, który wyśrodkuje dane i znajdzie współczynniki regresji (parametry) , gdzie „ + ”oznacza pseudoinwersję.b=(XX)1Xy=X+y

Równoważne przejście nie polega na centrowaniu, ale raczej na dodaniu stałego modelu jako pierwszej kolumny 1 s w X , a następnie oszacowaniu współczynników w taki sam sposób jak powyżej . Na razie w porządku.b=(XX)1Xy=X+y

Zdefiniujmy macierz C jako agregację (podsumowanie) macierzy X zmiennych niezależnych . Po prostu pokazuje, schemat kodowania obserwowana, - w kontraście kodowania macierzy (= macierz bazowa) .C=aggrX

C
              Const  A1    A2
Gr1 (A=1)       1     1     0
Gr2 (A=2)       1     0     1
Gr3 (A=3,ref)   1     0     0

Kolumny to zmienne (kolumny) X - elementarne zmienne kontrastowe A1 A2, w tym przypadku fikcyjne, a wszystkie wiersze to grupy / poziomy współczynnika. Podobnie była z naszą matrycą kodującą C dla wskaźnika lub schematu kodowania kontrastowego.

Teraz nazywa się macierzą współczynnika kontrastu lub macierzą L. Ponieważ C jest kwadratem, . Macierz kontrastu, odpowiadająca naszemu C - czyli kontrastom wskaźników w naszym przykładzie - jest zatem:L = C + = C - 1C+=LL=C+=C1

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const      0     0     1            => Const = Mean_Gr3
A1         1     0    -1            => Param1 = Mean_Gr1-Mean_Gr3
A2         0     1    -1            => Param2 = Mean_Gr2-Mean_Gr3

Macierz L to macierz pokazująca współczynniki kontrastu . Zauważ, że suma współczynników kontrastu w każdym rzędzie (z wyjątkiem stałej rzędu) wynosi . Każdy taki wiersz nazywa się kontrastem . Wiersze odpowiadają zmiennym kontrastu, a kolumny odpowiadają grupom, poziomom czynników.0

Znaczenie współczynników kontrastu polega na tym, że pomagają zrozumieć, co reprezentuje każdy efekt (każdy parametr b oszacowany w regresji z naszym X , zakodowanym w obecnej postaci) w sensie różnicy (porównanie grupowe). Natychmiast widzimy, zgodnie ze współczynnikami, że oszacowana stała będzie równa średniej Y w grupie odniesienia; ten parametr b1 (tj. zmiennej fikcyjnej A1) będzie równy różnicy: Y średnia w grupie 1 minus Y średnia w grupie 3; a parametr b2 jest różnicą: średnia w grupie 2 minus średnia w grupie 3.

Uwaga : Mówiąc „średnia” tuż powyżej (i dalej poniżej) mamy na myśli oszacowaną (przewidywaną przez model) średnią dla grupy, a nie średnią obserwowaną w grupie.

Uwaga pouczająca : Kiedy przeprowadzamy regresję za pomocą binarnych zmiennych predykcyjnych, parametr takiej zmiennej mówi o różnicy w Y między zmienną = 1 i zmienną = 0 grup. Jednak w sytuacji, gdy zmienne binarne są zbiorem k-1 zmiennychk pozornych reprezentujących współczynnik poziomu, znaczenie parametru staje się węższe : pokazuje różnicę Y między zmienną = 1 a (nie tylko zmienną = 0, ale nawet) zmienną referencyjną = 1 grupy.

Podobnie jak (po pomnożeniu przez y ) daje nam wartości b , podobnie ( a g g r X ) + przynosi znaczenia b .X+y(aggrX)+

OK, mamy podano definicję współczynnika kontrastu macierzy L . Ponieważ , symetrycznie C = L + = L - 1 , co oznacza, że ​​jeśli otrzymałeś lub skonstruowałeś macierz kontrastu L w oparciu o czynniki kategorialne - aby przetestować ten L w swojej analizie, wtedy masz wskazówkę, jak poprawnie zakodować zmienne predykcyjne kontrastu X , aby przetestować L za pomocą zwykłej regresjiL=C+=C1C=L+=L1 oprogramowanie (tj. przetwarzające tylko „ciągłe” zmienne w standardowy sposób OLS i w ogóle nie rozpoznające czynników kategorialnych). W naszym obecnym przykładzie kodowanie było zmiennymi typu wskaźnikowego (obojętnego).

ANOVA jako regresja: inne typy kontrastu .

Pokrótce obserwować inne rodzaje kontrastu (= systemów kodowania style = parametryzacji) dla czynnika kategorycznego A .

Odchylenia lub kontrasty efektów . Macierze C i L oraz znaczenie parametru:

C
              Const  A1    A2
Gr1 (A=1)       1     1     0
Gr2 (A=2)       1     0     1
Gr3 (A=3,ref)   1    -1    -1

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3      => Const = 1/3Mean_Gr3+1/3Mean_Gr2+1/3Mean_Gr3 = Mean_GU
A1        2/3  -1/3  -1/3      => Param1 = 2/3Mean_Gr1-1/3(Mean_Gr2+Mean_Gr3) = Mean_Gr1-Mean_GU
A2       -1/3   2/3  -1/3      => Param2 = 2/3Mean_Gr2-1/3(Mean_Gr1+Mean_Gr3) = Mean_Gr2-Mean_GU

                                  Parameter for the reference group3 = -(Param1+Param2) = Mean_Gr3-Mean_GU

                                  Mean_GU is grand unweighted mean = 1/3(Mean_Gr1+Mean_Gr2+Mean_Gr3)

Przez kodowanie dewiacyjne każda grupa czynnika jest porównywana z nieważoną średnią średnią, a Constant jest tą średnią średnią. To właśnie uzyskujesz w regresji z predyktorami kontrastu X zakodowanymi w sposób „odchylający” lub efektowy.

Proste kontrasty . Ten schemat kontrastów / kodowania jest hybrydą typów wskaźnika i odchylenia, daje znaczenie stałej jak w typie odchylenia i znaczenia innych parametrów jak w typie wskaźnika:

C
              Const  A1    A2
Gr1 (A=1)       1   2/3  -1/3
Gr2 (A=2)       1  -1/3   2/3
Gr3 (A=3,ref)   1  -1/3  -1/3

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3        => Const = as in Deviation
A1         1     0    -1         => Param1 = as in Indicator
A2         0     1    -1         => Param2 = as in Indicator

Helmert kontrastuje . Porównuje każdą grupę (z wyjątkiem odniesienia) z nieważoną średnią kolejnych grup, a Constant jest nieważoną średnią średnią. Matryce C i L :

C
              Const  A1    A2
Gr1 (A=1)       1   2/3    0
Gr2 (A=2)       1  -1/3   1/2
Gr3 (A=3,ref)   1  -1/3  -1/2

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3        => Const = Mean_GU
A1         1   -1/2  -1/2        => Param1 = Mean_Gr1-1/2(Mean_Gr2+Mean_Gr3)
A2         0     1    -1         => Param2 = Mean_Gr2-Mean_Gr3

Różnica lub odwrotne kontrasty Helmerta . Porównuje każdą grupę (z wyjątkiem odniesienia) ze średnią nieważoną poprzednich grup, a Constant jest nieważoną średnią średnią.

C
              Const  A1    A2
Gr1 (A=1)       1  -1/2  -1/3
Gr2 (A=2)       1   1/2  -1/3
Gr3 (A=3,ref)   1    0    2/3

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3        => Const = Mean_GU
A1        -1     1     0         => Param1 = Mean_Gr2-Mean_Gr1
A2       -1/2  -1/2    1         => Param2 = Mean_Gr3-1/2(Mean_Gr2+Mean_Gr1)

Powtarzające się kontrasty . Porównuje każdą grupę (z wyjątkiem odniesienia) z następną grupą, a Constant jest nieważoną wielką średnią.

C
              Const  A1    A2
Gr1 (A=1)       1   2/3   1/3
Gr2 (A=2)       1  -1/3   1/3
Gr3 (A=3,ref)   1  -1/3  -2/3

L
          Gr1   Gr2   Gr3
         (A=1) (A=2) (A=3)
Const     1/3   1/3   1/3        => Const = Mean_GU
A1         1    -1     0         => Param1 = Mean_Gr1-Mean_Gr2
A2         0     1    -1         => Param2 = Mean_Gr2-Mean_Gr3

Pytanie how exactly is contrast matrix specified?brzmi : patrząc na rodzaje kontrastów nakreślone do tej pory można zrozumieć, w jaki sposób. Każdy rodzaj ma swoją logikę, jak „wypełnić” wartościami w L . Logika odzwierciedla znaczenie każdego parametru - jakie są dwie kombinacje grup, które planuje się porównać.

Kontrasty wielomianowe . Są to trochę wyjątkowe, nieliniowe. Pierwszy efekt jest liniowy, drugi kwadratowy, następny sześcienny. Pozostawiam tutaj niezrozumiałe pytanie, w jaki sposób mają być konstruowane ich macierze C i L i czy są one odwrotnością względem siebie. Zapoznaj się z dogłębnymi wyjaśnieniami Antoniego Parellady na temat tego rodzaju kontrastu: 1 , 2 .

W zrównoważonych projektach kontrasty Helmert, reverse Helmert i wielomianowe są zawsze kontrastami ortogonalnymi . Inne typy rozważane powyżej nie są kontrastami ortogonalnymi. Ortogonalny (pod zrównoważeniem) jest kontrastem, gdzie w macierzy kontrastu suma L w każdym rzędzie (oprócz Const) wynosi zero, a suma iloczynu odpowiednich elementów każdej pary rzędów wynosi zero.

Oto miary podobieństwa kątów (korelacja cosinus i Pearsona) dla różnych typów kontrastu, z wyjątkiem wielomianu, którego nie testowałem. Dajmy jeden współczynnik A z kpoziomami, a następnie został on przekodowany na zbiór k-1zmiennych kontrastowych określonego typu. Jakie są wartości w macierzy korelacji lub cosinus między tymi zmiennymi kontrastowymi?

                     Balanced (equal size) groups     Unbalanced groups
Contrast type             cos        corr              cos        corr

INDICATOR                  0       -1/(k-1)             0         varied
DEVIATION                 .5          .5              varied      varied
SIMPLE                 -1/(k-1)    -1/(k-1)           varied      varied
HELMERT, REVHELMERT        0           0              varied      varied
REPEATED                varied   =  varied            varied      varied

   "=" means the two matrices are same while elements in matrix vary

Podaję tabelę z informacjami i pozostawiam to bez komentarza. Ma to pewne znaczenie dla głębszego spojrzenia na ogólne modelowanie liniowe.

Kontrasty zdefiniowane przez użytkownika . Właśnie to tworzymy, aby przetestować niestandardową hipotezę porównania. Zwykle suma w każdym oprócz pierwszego wiersza L powinna wynosić 0, co oznacza, że ​​dwie grupy lub dwie kompozycje grup są porównywane w tym wierszu (tj. Przez ten parametr).

Gdzie w końcu są parametry modelu ?

Czy są to wiersze czy kolumny L ? W całym powyższym tekście mówiłem, że parametry odpowiadają wierszom L , ponieważ wiersze reprezentują zmienne kontrastowe, predyktory. Chociaż kolumny są poziomami czynnika, grupy. Może się to wydawać sprzeczne z takim, na przykład, blokiem teoretycznym z odpowiedzi @Gus_est, w którym kolumny wyraźnie odpowiadają parametrom:

H0:[011000011000011][β0β1β2β3β4]=[000]

W rzeczywistości nie ma sprzeczności, a odpowiedź na „problem” brzmi: zarówno wiersze, jak i kolumny macierzy współczynnika kontrastu odpowiadają parametrom! Przypomnijmy tylko, że kontrasty (zmienne kontrastu), rzędy, zostały początkowo utworzone tak, aby reprezentowały wyłącznie poziomy czynników: są to poziomy oprócz pominiętego odniesienia. Porównaj proszę te dwie równoważne pisownice matrycy L dla prostego kontrastu:

L
          Gr1   Gr2   Gr3
          A=1   A=2   A=3(reference)
Const     1/3   1/3   1/3 
A1         1     0    -1  
A2         0     1    -1   

L
            b0    b1    b2    b3(redundant)
           Const  A=1   A=2   A=3(reference)
b0  Const   1    1/3   1/3   1/3 
b1  A1      0     1     0    -1  
b2  A2      0     0     1    -1   

Pierwszy jest tym, co pokazałem wcześniej, drugi to bardziej „teoretyczny” układ (dla ogólnej algebry modelu liniowego). Po prostu dodano kolumnę odpowiadającą warunkowi Stała. Współczynniki parametrów b oznaczają wiersze i kolumny. Jako parametr nadmiarowy b3 zostanie ustawiony na zero. Możesz pseudo odwrócić drugi układ, aby uzyskać matrycę kodującą C , gdzie wewnątrz w prawej dolnej części nadal znajdziesz poprawne kody dla zmiennych kontrastu A1 i A2. Tak będzie w przypadku każdego opisanego typu kontrastu (z wyjątkiem typu wskaźnika - gdzie pseudo-odwrotność takiego prostokątnego układu nie da poprawnego wyniku; prawdopodobnie dlatego wynaleziono prosty typ kontrastu dla wygody: współczynniki kontrastu identyczne z typem wskaźnika, ale dla stała wiersza).

Typ kontrastu i wyniki tabeli ANOVA .

(μ1=μ2,μ2=μ3)(μ1=μ23,μ2=μ3)(μ1=μ123,μ2=μ123)(μ1=μ3,μ2=μ3)

Programy ANOVA realizowane za pomocą ogólnego paradygmatu modelu liniowego mogą wyświetlać zarówno tabelę ANOVA (efekty łączone: główne, interakcje), jak i tabelę szacunków parametrów (efekty elementarne b ). Niektóre programy mogą wyświetlać tę ostatnią tabelę odpowiadającą typowi kontrastu jako ofertę złożoną przez użytkownika, ale większość będzie zawsze wyświetlać parametry odpowiadające jednemu typowi - często typowi wskaźnika, ponieważ programy ANOVA oparte na ogólnym modelu liniowym parametryzują specyficzne zmienne pozorne (najwygodniejsze do zrobienia), a następnie przełączyć na kontrasty za pomocą specjalnych formuł „łączących” interpretujących stały fikcyjny sygnał wejściowy na (dowolny) kontrast.

Natomiast w mojej odpowiedzi - pokazującej ANOVA jako regresję - „łącze” jest realizowane już na poziomie wejścia X , który wezwał do wprowadzenia pojęcia odpowiedniego schematu kodowania danych.

Kilka przykładów pokazujących testowanie kontrastów ANOVA za pomocą zwykłej regresji .

Wyświetlenie w SPSS żądania typu kontrastu w ANOVA i uzyskanie tego samego wyniku za pomocą regresji liniowej. Mamy pewien zestaw danych z Y i współczynnikami A (3 poziomy, odniesienie = ostatnie) i B (4 poziomy, odniesienie = ostatnie); znajdź dane poniżej później.

Odchylenie kontrastuje przykład w pełnym modelu czynnikowym (A, B, A * B). Żądany typ odchylenia zarówno dla A, jak i B (dla twojej informacji możemy wybrać inny typ dla każdego czynnika).

Macierz współczynnika kontrastu L dla A i B:

            A=1      A=2      A=3
Const     .3333    .3333    .3333 
dev_a1    .6667   -.3333   -.3333
dev_a2   -.3333    .6667   -.3333

            B=1      B=2      B=3      B=4
Const     .2500    .2500    .2500    .2500
dev_b1    .7500   -.2500   -.2500   -.2500 
dev_b2   -.2500    .7500   -.2500   -.2500 
dev_b3   -.2500   -.2500    .7500   -.2500

Poproś o program ANOVA ( GLMw SPSS) o wykonanie analizy wariancji i uzyskanie wyraźnych wyników dla kontrastów odchyleń:

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj

Typ kontrastu odchylenia w porównaniu A = 1 vs Wielka nieważona średnia i A = 2 z tą samą średnią. Czerwone elipsy piszą szacunki różnic i ich wartości p. Połączony efekt na współczynniku A jest nasycony czerwonym prostokątem. Dla czynnika B wszystko jest analogicznie wypisane na niebiesko. Wyświetlanie również tabeli ANOVA. Zauważ, że połączone efekty kontrastu odpowiadają głównym efektom.

wprowadź opis zdjęcia tutaj

Utwórzmy teraz zmienne kontrastujące fizycznie dev_a1, dev_a2, dev_b1, dev_b2, dev_b3 i uruchommy regresję. Odwróć matryce L, aby uzyskać matryce kodujące C :

      dev_a1   dev_a2
A=1   1.0000    .0000 
A=2    .0000   1.0000 
A=3  -1.0000  -1.0000

      dev_b1   dev_b2   dev_b3
B=1   1.0000    .0000    .0000 
B=2    .0000   1.0000    .0000 
B=3    .0000    .0000   1.0000 
B=4  -1.0000  -1.0000  -1.0000

X=DCDkk

Po utworzeniu zmiennych kontrastu pomnóż te z różnych czynników, aby uzyskać zmienne reprezentujące interakcje (nasz model ANOVA był w pełni silni): dev_a1b1, dev_a1b2, dev_a1b3, dev_a2b1, dev_a2b2, dev_a2b3. Następnie uruchom wielokrotną regresję liniową ze wszystkimi predyktorami.

wprowadź opis zdjęcia tutaj

Zgodnie z oczekiwaniami dev_a1 ma taki sam efekt, jak kontrast „Poziom 1 vs średnia”; dev_a2 jest taki sam, jak „Poziom 2 w porównaniu ze średnim” itd., itd. - porównaj części z tuszem z powyższą analizą kontrastu ANOVA.

Zauważ, że jeśli nie używamy zmiennych interakcji dev_a1b1, dev_a1b2 ... w regresji, wyniki będą zbieżne z wynikami analizy kontrastu ANOVA tylko z głównymi efektami.

Przykład prostych kontrastów w ramach tego samego pełnego modelu czynnikowego (A, B, A * B).

Macierz współczynnika kontrastu L dla A i B:

            A=1      A=2      A=3
Const     .3333    .3333    .3333 
sim_a1   1.0000    .0000  -1.0000
sim_a2    .0000   1.0000  -1.0000

            B=1      B=2      B=3      B=4
Const     .2500    .2500    .2500    .2500
sim_b1   1.0000    .0000    .0000  -1.0000
sim_b2    .0000   1.0000    .0000  -1.0000
sim_b3    .0000    .0000   1.0000  -1.0000

Wyniki ANOVA dla prostych kontrastów:

wprowadź opis zdjęcia tutaj

wprowadź opis zdjęcia tutaj

Ogólne wyniki (tabela ANOVA) są takie same, jak w przypadku kontrastów odchyleń (teraz nie są wyświetlane).

Twórz zmienne kontrastujące fizycznie sim_a1, sim_a2, sim_b1, sim_b2, sim_b3. Matryce kodujące poprzez odwrócenie macierzy L to (bez kolumny Const):

      sim_a1   sim_a2
A=1    .6667   -.3333
A=2   -.3333    .6667
A=3   -.3333   -.3333

      sim_b1   sim_b2   sim_b3
B=1    .7500   -.2500   -.2500
B=2   -.2500    .7500   -.2500
B=3   -.2500   -.2500    .7500
B=4   -.2500   -.2500   -.2500

X=DC

wprowadź opis zdjęcia tutaj

Tak jak poprzednio, widzimy, że wyniki regresji i ANOVA są zgodne. Parametrem regresji prostej zmiennej kontrastowej jest różnica (i jej test istotności) między tym poziomem współczynnika a poziomem odniesienia (ostatnim, w naszym przykładzie).

Dane dwuskładnikowe użyte w przykładach:

     Y      A      B
 .2260      1      1
 .6836      1      1
-1.772      1      1
-.5085      1      1
1.1836      1      2
 .5633      1      2
 .8709      1      2
 .2858      1      2
 .4057      1      2
-1.156      1      3
1.5199      1      3
-.1388      1      3
 .4865      1      3
-.7653      1      3
 .3418      1      4
-1.273      1      4
1.4042      1      4
-.1622      2      1
 .3347      2      1
-.4576      2      1
 .7585      2      1
 .4084      2      2
1.4165      2      2
-.5138      2      2
 .9725      2      2
 .2373      2      2
-1.562      2      2
1.3985      2      3
 .0397      2      3
-.4689      2      3
-1.499      2      3
-.7654      2      3
 .1442      2      3
-1.404      2      3
-.2201      2      4
-1.166      2      4
 .7282      2      4
 .9524      2      4
-1.462      2      4
-.3478      3      1
 .5679      3      1
 .5608      3      2
1.0338      3      2
-1.161      3      2
-.1037      3      3
2.0470      3      3
2.3613      3      3
 .1222      3      4

Przykład kontrastu zdefiniowany przez użytkownika . Dajmy jeden współczynnik F z 5 poziomami. Stworzę i przetestuję zestaw niestandardowych kontrastów ortogonalnych w ANOVA i regresji.

wprowadź opis zdjęcia tutaj

LL

Prześlijmy macierz do procedury ANOVA SPSS w celu przetestowania kontrastów. Cóż, możemy przesłać nawet jeden wiersz (kontrast) z macierzy, ale prześlemy całą macierz, ponieważ - podobnie jak w poprzednich przykładach - będziemy chcieli otrzymać te same wyniki za pomocą regresji, a program regresji będzie potrzebował pełnego zestaw zmiennych kontrastowych (należy pamiętać, że należą one do jednego czynnika!). Dodamy stały wiersz do L, tak jak poprzednio, chociaż jeśli nie będziemy musieli testować przechwytywania, możemy go bezpiecznie pominąć.

UNIANOVA Y BY F
  /METHOD=SSTYPE(3)
  /INTERCEPT=INCLUDE
  /CONTRAST (F)= special
       (.2 .2 .2 .2 .2
         3  3 -2 -2 -2
         1 -1  0  0  0
         0  0  2 -1 -1
         0  0  0  1 -1)
  /DESIGN=F.

Equivalently, we might also use this syntax (with a more flexible /LMATRIX subcommand)
if we omit the Constant row from the matrix.
UNIANOVA Y BY F
  /METHOD=SSTYPE(3)
  /INTERCEPT=INCLUDE
  /LMATRIX= "User contrasts"
       F  3  3 -2 -2 -2;
       F  1 -1  0  0  0;
       F  0  0  2 -1 -1;
       F  0  0  0  1 -1
  /DESIGN=F.

wprowadź opis zdjęcia tutaj

Ogólny efekt kontrastów (na dole zdjęcia) nie jest taki sam, jak oczekiwany ogólny efekt ANOVA:

wprowadź opis zdjęcia tutaj

ale jest to po prostu artefakt naszego wstawienia terminu Constant do macierzy L. Ponieważ SPSS już implikuje stałą, gdy określone są kontrasty zdefiniowane przez użytkownika. Usuń stały wiersz z L, a my otrzymamy te same wyniki kontrastów (matryca K na zdjęciu powyżej), z tym wyjątkiem, że kontrast L0 nie zostanie wyświetlony. Ogólny efekt kontrastu będzie pasował do ogólnej ANOVA:

wprowadź opis zdjęcia tutaj

C=L+X=DC

C
      use_f1   use_f2   use_f3   use_f4
F=1    .1000    .5000    .0000    .0000
F=2    .1000   -.5000    .0000    .0000
F=3   -.0667    .0000    .3333    .0000
F=4   -.0667    .0000   -.1667    .5000
F=5   -.0667    .0000   -.1667   -.5000

wprowadź opis zdjęcia tutaj

Obserwuj tożsamość wyników. Dane wykorzystane w tym przykładzie:

     Y      F
 .2260      1
 .6836      1
-1.772      1
-.5085      1
1.1836      1
 .5633      1
 .8709      1
 .2858      1
 .4057      1
-1.156      1
1.5199      2
-.1388      2
 .4865      2
-.7653      2
 .3418      2
-1.273      2
1.4042      2
-.1622      3
 .3347      3
-.4576      3
 .7585      3
 .4084      3
1.4165      3
-.5138      3
 .9725      3
 .2373      3
-1.562      3
1.3985      3
 .0397      4
-.4689      4
-1.499      4
-.7654      4
 .1442      4
-1.404      4
-.2201      4
-1.166      4
 .7282      4
 .9524      5
-1.462      5
-.3478      5
 .5679      5
 .5608      5
1.0338      5
-1.161      5
-.1037      5
2.0470      5
2.3613      5
 .1222      5

Kontrasty w analizach innych niż (M) ANOVA .

Gdziekolwiek pojawiają się predyktory nominalne, pojawia się pytanie o kontrast (jaki typ kontrastu wybrać, dla którego predyktora). Niektóre programy rozwiązują to wewnętrznie za kulisami, gdy ogólne wyniki omnibus nie będą zależeć od wybranego typu. Jeśli chcesz, aby określony typ wyświetlał więcej „elementarnych” wyników, musisz wybrać. Kontrast wybierasz (a raczej komponujesz) również podczas testowania niestandardowej hipotezy porównania.

(M) ANOVA i analiza loglinearna, mieszane, a czasem uogólnione modelowanie liniowe obejmuje opcje leczenia predyktorów za pomocą różnych rodzajów kontrastów. Ale, jak próbowałem pokazać, możliwe jest tworzenie kontrastów jako zmiennych kontrastowych jawnie i ręcznie. Następnie, jeśli nie masz pod ręką pakietu ANOVA, możesz to zrobić - pod wieloma względami z takim samym powodzeniem - z wielokrotną regresją.


1
proszę nie ograniczaj tej odpowiedzi tylko do anova, jeśli to możliwe. Tag [anova] został dodany przez @amoeba do czasu, kiedy odpowiedziałeś na moje pytanie, ale nie chcę, aby odpowiedź była ograniczona tylko do anova.
Ciekawy

CLCL

@amoeba, nie znam „matrycy kontrastu” i jestem prawie pewien, że oznacza ona „matrycę współczynnika kontrastu” lub matrycę L, która jest oficjalnym lub co najmniej szerokim terminem rozpiętości w (M) ANOVA / GLM. Termin „matryca kodowania kontrastu” jest znacznie rzadziej wymieniany, ponieważ jest to po prostu zagregowany widok matrycy projektowej X; Widziałem słowo „matryca bazowa” używane w artykułach jednego ze starszych statystów SPSS, Dave'a Nicholsa. Oczywiście, macierze L (oficjalna etykieta) i C (dowolna etykieta?) Są tak ściśle ze sobą powiązane, że z trudem można dyskutować jedna bez drugiej. Przypuszczam, że za tę parę należy uważać „matrycę kontrastu”.
ttnphns

1
Tak, zgadzam się. Do tej pory jestem przekonany, że „matryca kontrastu” jest terminem używanym tylko w społeczności R i odnosi się do schematu kodowania. Sprawdziłem podręcznik, do którego odnosi się Gus_est, i nigdy nie używają terminu „matryca kontrastu”, mówią tylko o „kontrastach” (patrz mój ostatni komentarz pod jego odpowiedzią). OP wyraźnie pytał o „matrycę kontrastu” w sensie R.
ameba mówi Przywróć Monikę

1
That L will determine what are you going to test, you aren't free anymore to choose what to testβi=0β1β2/2β3/2=0

17

Użyję małych liter dla wektorów i wielkich liter dla matryc.

W przypadku modelu liniowego formy:

y=Xβ+ε

gdzie jest macierzą rangi , i przyjmujemy . n × ( k + 1 ) k + 1 n ε N ( 0 , σ 2 )Xn×(k+1)k+1nεN(0,σ2)

Możemy oszacować przez , ponieważ istnieje odwrotność .β^(XX)1XyXX

Teraz w przypadku ANOVA mamy do czynienia z tym, że nie ma już pełnej rangi. Oznacza to, że nie mamy i musimy zadowolić się uogólnionym odwrotnością .X(XX)1(XX)

Jednym z problemów korzystania z tej uogólnionej odwrotności jest to, że nie jest ona unikalna. Innym problemem jest to, że nie możemy znaleźć obiektywnego estymatora dla , ponieważ β

β^=(XX)XyE(β^)=(XX)XXβ.

Dlatego nie możemy oszacować . Ale czy możemy oszacować liniową kombinację ?ββ

Mamy liniową kombinację , powiedzmy , można oszacować, jeśli istnieje wektor taki, że .βgβaE(ay)=gβ


W kontrasty są szczególnym przypadku funkcji oszacowania, w których suma współczynników jest równa zeru.g

I pojawiają się kontrasty w kontekście predyktorów jakościowych w modelu liniowym. (jeśli sprawdzisz instrukcję połączoną przez @amoeba, zobaczysz, że wszystkie ich kodowanie kontrastu jest powiązane ze zmiennymi kategorialnymi). Następnie, odpowiadając na @Curious i @amoeba, widzimy, że powstają one w ANOVA, ale nie w „czystym” modelu regresji z tylko ciągłymi predyktorami (możemy również mówić o kontrastach w ANCOVA, ponieważ mamy w sobie pewne zmienne kategoryczne).


Teraz w modelu gdzie nie ma pełnej rangi, a , funkcja liniowa jest możliwa do oszacowania, jeśli istnieje wektor taki, że . Oznacza to, że jest liniową kombinacją wierszy . Ponadto istnieje wiele opcji wektora , na przykład , jak widać w poniższym przykładzie.

y=Xβ+ε
XE(y)=XβgβaaX=ggXaaX=g

Przykład 1

Rozważmy model jednokierunkowy:

yij=μ+αi+εij,i=1,2,j=1,2,3.

X=[110110110101101101],β=[μτ1τ2]

Załóżmy, że , więc chcemy oszacować .g=[0,1,1][0,1,1]β=τ1τ2

Widzimy, że istnieją różne opcje wektora które dają : take ; lub ; lub .aaX=ga=[0,0,1,1,0,0]a=[1,0,0,0,0,1]a=[2,1,0,0,1,2]


Przykład 2

Weźmy dwukierunkowy model: .

yij=μ+αi+βj+εij,i=1,2,j=1,2

X=[11010110011011010101],β=[μα1α2β1β2]

Możemy zdefiniować przewidywalne funkcje, biorąc liniowe kombinacje wierszy .X

Odejmowanie wiersza 1 od wierszy 2, 3 i 4 (z ): X

[11010000110110001111]

I biorąc rzędy 2 i 3 z czwartego rzędu:

[11010000110110000000]

Pomnożenie tego przez daje: β

g1β=μ+α1+β1g2β=β2β1g3β=α2α1

Mamy więc trzy liniowo niezależne, estymowalne funkcje. Teraz tylko i można uznać za kontrasty, ponieważ suma jego współczynników (lub wiersza suma odpowiedniego wektora ) jest równa zero.g2βg3βg


Wracając do modelu zrównoważonego w jedną stronę

yij=μ+αi+εij,i=1,2,,k,j=1,2,,n.

Załóżmy, że chcemy przetestować hipotezę .H0:α1==αk

W tym ustawieniu macierz nie ma pełnej rangi, więc nie jest unikalny i nie do oszacowania. Aby to oszacować, możemy pomnożyć przez , o ile . Innymi słowy, można iff .Xβ=(μ,α1,,αk)βgigi=0igiαiigi=0

Dlaczego to prawda?

Wiemy, że można jeśli istnieje wektor taki, że . Biorąc różne wiersze i , a następnie: gβ=(0,g1,,gk)β=igiαiag=aXXa=[a1,,ak]

[0,g1,,gk]=g=aX=(iai,a1,,ak)

Wynik jest następujący.


Jeśli chcielibyśmy przetestować konkretny kontrast, nasza hipoteza to . Na przykład: , którą można zapisać jako , więc porównujemy ze średnią i .H0:giαi=0H0:2α1=α2+α3H0:α1=α2+α32α1α2α3

Hipotezę tę można wyrazić jako , gdzie . W tym przypadku i testujemy tę hipotezę za pomocą następującej statystyki: H0:gβ=0g=(0,g1,g2,,gk)q=1

F=[gβ^][g(XX)g]1gβ^SSE/k(n1).

Jeśli jest wyrażone jako gdzie wiersze macierzy są wzajemnie ortogonalnymi kontrastami ( ), a następnie możemy przetestować przy użyciu statystyki , gdzieH0:α1=α2==αkGβ=0

G=[g1g2gk]
gigj=0H0:Gβ=0F=SSHrank(G)SSEk(n1)SSH=[Gβ^][G(XX)1G]1Gβ^.

Przykład 3

Aby to lepiej zrozumieć, i załóżmy, że chcemy przetestować które można wyrazić jako k=4H0:α1=α2=α3=α4,

H0:[α1α2α1α3α1α4]=[000]

Lub, jako : H0:Gβ=0

H0:[011000101001011]G,our contrast matrix[μα1α2α3α4]=[000]

Widzimy więc, że trzy rzędy naszej matrycy kontrastu są określone przez współczynniki kontrastów będących przedmiotem zainteresowania. Każda kolumna podaje poziom współczynnika, którego używamy w naszym porównaniu.


Prawie wszystko, co napisałem, zostało wzięte \ skopiowane (bezwstydnie) z Rencher & Schaalje, „Modele liniowe w statystyce”, rozdziały 8 i 13 (przykłady, sformułowanie twierdzeń, niektóre interpretacje), ale inne rzeczy, takie jak termin „matryca kontrastowa” „(które tak naprawdę nie pojawia się w tej książce) i podana tutaj definicja była moja.


Powiązanie macierzy kontrastu OP z moją odpowiedzią

Jedna z macierzy OP (które można również znaleźć w tym podręczniku ) to:

> contr.treatment(4)
  2 3 4
1 0 0 0
2 1 0 0
3 0 1 0
4 0 0 1

W tym przypadku nasz współczynnik ma 4 poziomy i możemy napisać model w następujący sposób: Można to zapisać w postaci macierzy jako:

[y11y21y31y41]=[μμμμ]+[a1a2a3a4]+[ε11ε21ε31ε41]

Lub

[y11y21y31y41]=[11000101001001010001]X[μa1a2a3a4]β+[ε11ε21ε31ε41]

Teraz, dla przykładu kodowania fikcyjnego w tej samej instrukcji, używają jako grupy referencyjnej. W ten sposób odejmujemy wiersz 1 od każdego innego wiersza w macierzy , co daje :a1XX~

[11000011000101001001]

Jeśli zaobserwujesz numerację wierszy i kolumn w macierzy contr.treatment (4), zobaczysz, że uwzględniają one wszystkie wiersze i tylko kolumny związane z czynnikami 2, 3 i 4. Jeśli zrobimy to samo w powyższa macierz daje:

[000100010001]

W ten sposób macierz contr.treatment (4) mówi nam, że porównują czynniki 2, 3 i 4 ze współczynnikiem 1 i porównują czynnik 1 ze stałą (oto moje rozumienie powyższego).

I, definiując (tj. Biorąc tylko wiersze, które sumują się do 0 w powyższej macierzy): G

[011000101001001]

Możemy przetestować i znaleźć szacunki kontrastów.H0:Gβ=0

hsb2 = read.table('http://www.ats.ucla.edu/stat/data/hsb2.csv', header=T, sep=",")

y<-hsb2$write

dummies <- model.matrix(~factor(hsb2$race)+0)
X<-cbind(1,dummies)

# Defining G, what I call contrast matrix
G<-matrix(0,3,5)
G[1,]<-c(0,-1,1,0,0)
G[2,]<-c(0,-1,0,1,0)
G[3,]<-c(0,-1,0,0,1)
G
     [,1] [,2] [,3] [,4] [,5]
[1,]    0   -1    1    0    0
[2,]    0   -1    0    1    0
[3,]    0   -1    0    0    1

# Estimating Beta

X.X<-t(X)%*%X
X.y<-t(X)%*%y

library(MASS)
Betas<-ginv(X.X)%*%X.y

# Final estimators:
G%*%Betas
          [,1]
[1,] 11.541667
[2,]  1.741667
[3,]  7.596839

Szacunki są takie same.


Odnosząc odpowiedź @ttnphns do mojej.

W pierwszym przykładzie konfiguracja ma kategoryczny współczynnik A mający trzy poziomy. Możemy to zapisać jako model (załóżmy dla uproszczenia, że ): j=1

yij=μ+ai+εij,for i=1,2,3

Załóżmy, że chcemy przetestować lub , przy czym jest naszą grupą odniesienia / czynnikiem.H0:a1=a2=a3H0:a1a3=a2a3=0a3

Można to zapisać w formie macierzy jako:

[y11y21y31]=[μμμ]+[a1a2a3]+[ε11ε21ε31]

Lub

[y11y21y31]=[110010101001]X[μa1a2a3]β+[ε11ε21ε31]

Teraz, jeśli odejmiemy wiersz 3 od rzędu 1 i rzędu 2, otrzymamy, że stanie się (nazywam to :XX~

X~=[010100111001]

Porównaj 3 ostatnie kolumny powyższej macierzy z macierzą @ttnphns . Pomimo kolejności są dość podobne. Rzeczywiście, jeśli pomnożymy , otrzymamy:LX~β

[010100111001][μa1a2a3]=[a1a3a2a3μ+a3]

Mamy więc przewidywalne funkcje: ; ; .c1β=a1a3c2β=a2a3c3β=μ+a3

Ponieważ , z powyższego wynika, że ​​porównujemy naszą stałą ze współczynnikiem dla grupy odniesienia (a_3); współczynnik grupy 1 do współczynnika grupy 3; oraz współczynnik grupy 2 do grupy3. Lub, jak powiedział @ttnphns: „Od razu widzimy, zgodnie ze współczynnikami, że oszacowana stała będzie równa średniej Y w grupie odniesienia; ten parametr b1 (tj. Zmiennej obojętnej A1) będzie równy różnicy: średnia Y w grupie 1 minus Średnia Y w grupie 3; parametr b2 jest różnicą: średnia w grupie 2 minus średnia w grupie 3. ”H0:ciβ=0

Ponadto zauważ, że (zgodnie z definicją kontrastu: funkcja przewidywalna + suma wiersza = 0), że wektory i są kontrastami. A jeśli utworzymy macierz kontrastów, otrzymamy:c1c2G

G=[01010011]

Nasza matryca kontrastu do testowaniaH0:Gβ=0

Przykład

Użyjemy tych samych danych, co „Przykład kontrastu zdefiniowany przez użytkownika” @ttnphns (chciałbym wspomnieć, że teoria, którą tu napisałem, wymaga kilku modyfikacji w celu uwzględnienia modeli z interakcjami, dlatego wybrałem ten przykład. Jednak , definicje kontrastów i - jak to nazywam - matryca kontrastu pozostają takie same).

Y<-c(0.226,0.6836,-1.772,-0.5085,1.1836,0.5633,0.8709,0.2858,0.4057,-1.156,1.5199,
     -0.1388,0.4865,-0.7653,0.3418,-1.273,1.4042,-0.1622,0.3347,-0.4576,0.7585,0.4084,
     1.4165,-0.5138,0.9725,0.2373,-1.562,1.3985,0.0397,-0.4689,-1.499,-0.7654,0.1442,
     -1.404,-0.2201,-1.166,0.7282,0.9524,-1.462,-0.3478,0.5679,0.5608,1.0338,-1.161,
     -0.1037,2.047,2.3613,0.1222)

F_<-c(1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,3,3,3,3,3,3,3,3,3,3,3,4,4,4,4,4,4,4,4,4,
    5,5,5,5,5,5,5,5,5,5,5)

dummies.F<-model.matrix(~as.factor(F_)+0)

X_F<-cbind(1,dummies.F)

G_F<-matrix(0,4,6)
G_F[1,]<-c(0,3,3,-2,-2,-2)
G_F[2,]<-c(0,1,-1,0,0,0)
G_F[3,]<-c(0,0,0,2,-1,-1)
G_F[4,]<-c(0,0,0,0,1,-1)

 G 
 [,1] [,2] [,3] [,4] [,5] [,6]
[1,]    0    3    3   -2   -2   -2
[2,]    0    1   -1    0    0    0
[3,]    0    0    0    2   -1   -1
[4,]    0    0    0    0    1   -1

# Estimating Beta 

X_F.X_F<-t(X_F)%*%X_F
X_F.Y<-t(X_F)%*%Y

Betas_F<-ginv(X_F.X_F)%*%X_F.Y

# Final estimators:
G_F%*%Betas_F
           [,1]
[1,]  0.5888183
[2,] -0.1468029
[3,]  0.6115212
[4,] -0.9279030

Mamy więc te same wyniki.


Wniosek

Wydaje mi się, że nie ma jednego definiującego pojęcia, czym jest matryca kontrastu.

Jeśli weźmiesz definicję kontrastu podaną przez Scheffe („Analiza wariancji”, strona 66), zobaczysz, że jest to przewidywalna funkcja, której współczynniki sumują się do zera. Jeśli więc chcemy przetestować różne liniowe kombinacje współczynników naszych zmiennych kategorialnych, używamy macierzy . Jest to macierz, w której rzędy sumują się do zera, której używamy do pomnożenia naszej macierzy współczynników, aby umożliwić oszacowanie tych współczynników. Jego rzędy wskazują różne liniowe kombinacje kontrastów, które testujemy, a kolumny wskazują, które czynniki (współczynniki) są porównywane.G

Ponieważ powyższa macierz jest skonstruowana w taki sposób, że każdy jej wiersz składa się z wektora kontrastu (który sumuje się do 0), dla mnie sensowne jest nazywanie „macierzą kontrastu” ( Monahan - „Elementarz w modelach liniowych” - również używa tej terminologii).GG

Jednak, jak to pięknie wyjaśnia @ttnphns, oprogramowanie nazywa coś innego „matrycą kontrastu” i nie mogłem znaleźć bezpośredniego związku między macierzą a wbudowanymi poleceniami / macierzami SPSS (@ttnphns ) lub R (pytanie OP), tylko podobieństwa. Ale wierzę, że miła dyskusja / współpraca przedstawione tutaj pomogą wyjaśnić takie pojęcia i definicje.G


proszę nie ograniczaj tej odpowiedzi tylko do anova, jeśli to możliwe. Tag [anova] został dodany przez @amoeba do czasu, kiedy odpowiedziałeś na moje pytanie, ale nie chcę, aby odpowiedź była ograniczona tylko do anova.
Ciekawy

Wielkie dzięki za tak dużą aktualizację. Usunąłem niektóre z moich wcześniejszych komentarzy, które były już nieaktualne (możesz usunąć część swoich, np. Pierwszy). Jednak do tej pory jest dla mnie jasne, że „matryca kontrastu” w twoim (i Monahana) sensie jest czymś zupełnie innym niż „matryca kontrastu” w tym sensie, że jest używana w tym podręczniku R, a także w pierwotnym pytaniu tutaj (jak to nazywa ttnphns) Macierz C). Myślę, że miałoby to sens, gdybyś zanotował gdzieś w swojej odpowiedzi o tej różnicy.
ameba mówi Przywróć Monikę

Mam problemy ze zrozumieniem, zaczynając od przykładu 1. Co to jest w notacji ? Co to jest i co oznaczają kolumny ? Czy to jest pojęcie Stałe (kolumna jedynek) i dwie zmienne obojętne? ijyijaiX
ttnphns

@ttnphns: oznacza grupę indeksującą (w przykładzie 1 są dwie grupy), oznacza punkt danych wewnątrz każdej grupy. jest stałą, a są stałymi dla każdej grupy, tak że są grupowymi (więc może być całkowitą średnią, a może być odchyleniem średnich grupowych od całkowitej średniej). Kolumny są stałymi terminami i dwie manekiny, tak. ijμαiμ+αiμαiX
ameba mówi Przywróć Monikę

Dziękuję za tę odpowiedź, ale prawdopodobnie nigdy nie będę w stanie jej zrozumieć. I studiowałem matematykę :-) Spodziewałem się bardzo prostej definicji jako odpowiedzi :-)
Ciekawy

7

„Matryca kontrastu” nie jest standardowym terminem w literaturze statystycznej. Może mieć [co najmniej] dwa powiązane odrębnymi znaczeniami:

  1. Macierz określająca szczególną hipotezę zerową w regresji ANOVA (niezwiązanej ze schematem kodowania), gdzie każdy wiersz jest kontrastem . To nie jest standardowe użycie tego terminu. Korzystałem z wyszukiwania pełnotekstowego w płaszczyźnie Christensena Odpowiedzi na złożone pytania , Rutherford Przedstawiamy ANOVA i ANCOVA; Podejście GLM oraz modele liniowe Renchera i Schaalje w statystyce . Wszyscy dużo mówią o „kontrastach”, ale nigdy nie wspominają o „matrycy kontrastów”. Jednak, jak stwierdzono @Gus_est, termin ten jest używany w Podkładzie Monahana na modelach liniowych .

  2. Macierz określająca schemat kodowania macierzy projektowej w regresji ANOVA. W ten sposób w społeczności R używa się terminu „matryca kontrastowa” (patrz np. Ten podręcznik lub strona pomocy ).

Odpowiedź @Gus_est bada pierwsze znaczenie. Odpowiedź @ttnphns bada drugie znaczenie (nazywa to „macierzą kodowania kontrastu”, a także omawia „macierz współczynnika kontrastu”, który jest standardowym terminem w literaturze SPSS).


Rozumiem, że pytałeś o znaczenie # 2, więc oto definicja:

„Matryca kontrastu” w tym znaczeniu, R oznacza matrycy , gdzie jest liczbą grup, określające jak członków grupy są kodowane w różnych matryc . W szczególności, jeśli obserwacja należy do grupy to .k×kCkXmiXmj=Cij

Uwaga: zwykle pierwsza kolumna jest kolumną wszystkich (odpowiadającą kolumnie przechwytywania w macierzy projektu). Kiedy wywołujesz komendy R takie jak , dostajesz macierz bez tej pierwszej kolumny.Ccontr.treatment(4)C


Planuję rozszerzyć tę odpowiedź, aby skomentować, w jaki sposób odpowiedzi @ttnphns i @Gus_est pasują do siebie.


The answer by @Gus_est explores the first meaning. The answer by @ttnphns explores the second meaning.Protestuję (I jestem zaskoczony słysząc - po tym, jak obaj przeprowadziliśmy długą rozmowę na temat definicji w komentarzach do mty odpowiedzi.) Zaprosiłem dwa terminy: macierz współczynnika kontrastu (gdzie rzędy to kontrasty, kombinacja liniowa średnich), czyli macierz L, i matryca schematu kodowania kontrastu , znana również jako macierz C. Oba są powiązane, omówiłem oba.
ttnphns

(ciąg dalszy). Macierz współczynnik kontrastu L się terminem w ANOVA / uogólniony liniowy model stosowany w podręcznikach i Dokumenty SPSS, np . Schematy kodowania patrz tutaj .
ttnphns

You were asking about meaning #2W rzeczywistości nie jesteśmy pewni, jakie znaczenie miał termin PO. OP pokazał kilka przykładów schematów kodowania kontrastu - niekoniecznie oznacza to, że nie był zainteresowany matrycami L.
ttnphns

1
Cieszę się, że teraz mówimy tym samym językiem. Przynajmniej tak się wydaje. Byłoby wspaniale dla wszystkich, szczególnie dla czytelników odwiedzających, jeśli osiągniesz odpowiedź, pokazując, w jaki sposób raporty Gus i ttnphns przekształcają się w ten sam wynik. Jeśli chcesz to osiągnąć.
ttnphns,

1
(cd.) Oczywiście macierz L w obu „podejściach” jest taka sama (i nie jest wymagana tajemnicza macierz G). Pokaż, że dwie równoważne ścieżki (L jest dowolne, X to manekiny): L -> XC -> regression -> resulti X -> [regression -> adjusting to test for L] -> resultpozostaw ten sam wynik. Druga ścieżka to, jak zrobi program ANOVA (część w nawiasach kwadratowych []); 1. ścieżka jest dydaktycznym pokazem, w jaki sposób kontrasty można rozwiązać za pomocą samego programu regresji.
ttnphns,

3

Kontrast porównuje dwie grupy, porównując ich różnicę z zerem. W matrycy kontrastów wiersze są kontrastami i muszą być zerem, kolumny to grupy. Na przykład:

Załóżmy, że masz 4 grupy A, B, C, D, które chcesz porównać, wówczas macierz kontrastu byłaby:

Grupa: ABCD
A vs B: 1 -1 0 0
C vs D: 0 0 -1 1
A, B vs D, C: 1 1 -1 -1

Parafrazując zrozumienie eksperymentów przemysłowych :

Jeśli istnieje grupa k obiektów do porównania, z k średnimi podgrup, kontrast jest definiowany na tym zbiorze k obiektów przez dowolny zestaw współczynników k, [c1, c2, c3, ... cj, ..., ck ] ta suma do zera.

Niech zatem C będzie kontrastem,

C=c1μ1+c2μ2+...cjμj+...ckμk

C=j=1kcjμj

z ograniczeniem

j=1kcj=0

Te podgrupy, którym przypisano współczynnik zero, zostaną wykluczone z porównania. (*)

To znaki współczynników faktycznie definiują porównanie, a nie wybrane wartości. Bezwzględne wartości współczynników mogą być dowolne, o ile suma współczynników wynosi zero.

(*) Każde oprogramowanie statystyczne ma inny sposób wskazywania, które podgrupy zostaną wykluczone / włączone.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.