Czy błędem jest użycie ANOVA zamiast testu t do porównania dwóch średnich?


11

Mam rozkład wynagrodzeń i chcę porównać różnicę w środkach dla mężczyzn i kobiet. Wiem, że istnieje test T studenta do porównywania dwóch średnich, ale po zasugerowaniu ANOVA spotkałem się z krytyką mówiącą, że ANOVA służy do porównania więcej niż dwóch średnich.

Co (jeśli cokolwiek) jest niewłaściwe w używaniu go do porównywania tylko 2 środków?


9
Kto powiedział, że to źle?
Gung - Przywróć Monikę

1
Dlaczego nie sformułujesz pytania, które tłumi jakiekolwiek założenia? Coś w stylu „Czy ANOVA odpowiada testowi t podczas porównywania dwóch grup?” Pomysł ... Nie wezmę odpowiedzialności za to, jak mile widziane jest to pytanie :-)
Antoni Parellada

4
Ewentualnie zmodyfikuj swoje pytanie, aby pokazać komuś, że mówi, że jest nie tak ... abyśmy mogli wyjaśnić, że się mylą. Trudność polega na tym, że przesłanka pytania (że jest błędna) jest błędna.
Glen_b

1
Chociaż przesłanka jest błędna, pytanie to nie wydaje się nie na temat lub jest tak niejasne, że nie można na nie odpowiedzieć (w rzeczywistości odpowiedź została udzielona). Myślę, że to może pozostać otwarte.
gung - Przywróć Monikę

1
Zgoda, @ gung. Myślę, że pytanie odzwierciedla brak wiedzy na ten temat. Gdyby zostało sformułowane inaczej (lub „lepiej”), pytanie prawdopodobnie nie zostałoby zadane, ponieważ wtedy znaliby odpowiedź.
D_Williams

Odpowiedzi:


20

Nie jest to złe i będzie równoważne testowi, który zakłada równe wariancje. Ponadto, w przypadku dwóch grup, sqrt (statystyka f) równa się (wartość aboslute) statystyki t. Jestem pewien, że test t z nierównymi wariancjami nie jest równoważny. Ponieważ można uzyskać odpowiednie oszacowania, gdy wariancje są nierówne (wariancje są zwykle zawsze nierówne do pewnego miejsca po przecinku), prawdopodobnie warto zastosować test t, ponieważ jest on bardziej elastyczny niż ANOVA (zakładając, że masz tylko dwie grupy).

Aktualizacja:

Oto kod pokazujący, że statystyka t ^ 2 dla testu t równej wariancji, ale nie dla nierównego testu t, jest taka sama jak statystyka f.

dat_mtcars <- mtcars

# unequal variance model
 t_unequal <- t.test(mpg ~ factor(vs), data = dat_mtcars)
 t_stat_unequal <-  t_unequal$statistic

# assume equal variance
 t_equal <- t.test(mpg ~ factor(vs), var.equal = TRUE, data = dat_mtcars)
 t_stat_equal <- t_equal$statistic

# anova
 a_equal <- aov(mpg ~ factor(vs), data = dat_mtcars)
 f_stat <- anova(a_equal)
 f_stat$`F value`[1]

# compare by dividing (1 = equivalence)
 (t_stat_unequal^2) / f_stat$`F value`[1] 
 (t_stat_equal^2) / f_stat$`F value`[1] # (t-stat with equal var^2) = F

3
+1, należy pamiętać, że możliwe jest dostosowanie jednostronnego testu ANOVA / F dla nierównych wariancji (por. Alternatywy dla jednostronnej analizy ANOVA dla danych heteroskedastycznych ).
gung - Przywróć Monikę

@gung OK. Nie byłem tego pewien, ponieważ od pewnego czasu nie używałem ANOVA (robiłem coś bayesowskiego).
D_Williams,

Jest jeszcze jedna zaleta wykonywania testów : Jeśli masz hipotezę kierunkową, możesz wykonać jednostronny test ; Z drugiej strony ANOVA zawsze testuje hipotezy bezkierunkowe. tt
crsh

4

Są równoważne. ANOVA z tylko dwiema grupami jest równoważna testowi t. Różnica polega na tym, że gdy masz kilka grup, błąd typu I wzrośnie dla testów t, ponieważ nie jesteś w stanie wspólnie przetestować hipotezy. ANOVA nie cierpi z powodu tego problemu, ponieważ wspólnie testujesz je za pomocą testu F.


1
Nie sądzę, że traci moc, myślę, że ma to więcej wspólnego z błędami typu I. Ogólnie rzecz biorąc, im więcej masz testów, tym większą moc powinieneś uzyskać.
HelloWorld,

Wierzę (jak mówi @StudentT), że jest to kwestia błędów typu I. W trakcie kursu zakładam, że używają właśnie do tego „korekcji Bonferroniego”. en.wikipedia.org/wiki/Bonferroni_correction
Pablo Fernandez

Tak, masz rację. Nie powinna to być moc (typ II), ale błędy typu I. Uważam, że uzasadnienie jest poprawne, ale z jakiegoś powodu napisałem moc, a nie błąd typu 1. Przeredaguję, aby upewnić się, że nikogo nie oszukam.
robinsa
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.