Po prostu w celu wzmocnienia - wierzę, że jestem najnowszym wnioskodawcą.
W szczegółowym komentarzu do punktów Mike'a:
To prawda, że różnica I / II / III dotyczy tylko skorelowanych predyktorów (z których najbardziej niezrównoważonym przykładem są modele niezrównoważone, z pewnością w czynnikowej ANOVA) - ale wydaje mi się to argumentem, który odrzuca analizę niezrównoważonej sytuacji (a stąd jakakolwiek debata typu I / II / III). Może to być niedoskonałe, ale tak właśnie się dzieje (iw wielu kontekstach koszty dalszego gromadzenia danych przeważają nad problemem statystycznym, pomimo zastrzeżeń).
Jest to całkowicie uczciwe i reprezentuje mięso większości argumentów „II kontra III”, faworyzując II ”, z którymi się spotkałem. Najlepsze podsumowanie, z jakim się spotkałem, to Langsrud (2003) „ANOVA dla niezrównoważonych danych: użyj sumy kwadratów typu III zamiast sumy kwadratów typu III”, Statistics and Computing 13: 163-167 (Mam plik PDF, jeśli trudno jest znaleźć oryginał ). Argumentuje (biorąc pod uwagę przypadek dwuskładnikowy jako podstawowy przykład), że jeśli istnieje interakcja, to jest interakcja, więc rozważenie głównych efektów jest zwykle bez znaczenia (oczywiście słuszna kwestia) - a jeśli nie ma interakcji, analiza typu II główne efekty są silniejsze niż Typ III (bez wątpienia), dlatego zawsze powinieneś wybierać z Typem II. Widziałem inne argumenty (np. Venables,
I zgadzam się z tym: jeśli masz interakcję, ale masz również pytanie dotyczące głównego efektu, prawdopodobnie znajdujesz się na terytorium zrób to sam.
Oczywiście są tacy, którzy chcą tylko typu III, ponieważ robi to SPSS, lub innego odniesienia do statystycznej wyższej władzy. Nie jestem całkowicie przeciwny temu poglądowi, jeśli sprowadza się to do wyboru wielu ludzi trzymających się SPSS (przeciwko którym mam pewne rzeczy, a mianowicie czasu, pieniędzy i warunków wygaśnięcia licencji) i SS typu III lub wielu ludzie przechodzący na R i SS typu III. Jednak ten argument jest wyraźnie kiepski statystycznie.
Jednak argument, który uznałem za bardziej znaczący na korzyść typu III, jest wysunięty niezależnie przez Myers & Well (2003, „Research Design and Statistics Analysis”, s. 323, 626-629) oraz Maxwell & Delaney (2004, „ Projektowanie eksperymentów i analiza danych: perspektywa porównania modelu ”, s. 324–328, 332–335). To jest następująco:
- w przypadku interakcji wszystkie metody dają ten sam wynik dla sumy interakcji kwadratów
- Typ II zakłada, że nie ma interakcji dla testu głównych efektów; typ III nie
- Niektórzy (np. Langsrud) twierdzą, że jeśli interakcja nie jest znacząca, masz uzasadnione założenie, że jej nie ma i patrząc na (mocniejsze) główne efekty Typu II
- Ale jeśli test interakcji jest niewystarczający, ale istnieje interakcja, interakcja może wyjść „nieistotna”, ale nadal prowadzić do naruszenia założeń testu głównych efektów typu II, powodując, że testy te będą zbyt liberalne .
- Myers & Well przytaczają Appelbaum / Cramer jako głównych zwolenników podejścia typu II i kontynuują [p323]: „... Można zastosować bardziej konserwatywne kryteria nieistotności interakcji, takie jak wymaganie, aby interakcja nie była znacząca w poziom .25, ale nie ma wystarczającego zrozumienia konsekwencji nawet takiego podejścia. Zasadniczo sumy kwadratów typu II nie powinny być obliczane, chyba że istnieje silny a priori powód, aby zakładać brak efektów interakcji i wyraźnie nieistotną interakcję suma kwadratów." Przytaczają [p629] Ogólnie, Lee i Hornick 1981 jako dowód, że interakcje, które nie mają znaczenia, mogą wpływać na testy głównych efektów. Maxwell i Delaney [p334] opowiadają się za podejściem typu II, jeśli interakcja populacji wynosi zero, dla mocy, oraz podejście typu III, jeśli nie jest [dla interpretowalności środków pochodzących z tego podejścia]. Oni również opowiadają się za użyciem Typu III w rzeczywistej sytuacji (kiedy wnioskujesz o obecności interakcji na podstawie danych) z powodu problemu popełnienia błędu typu 2 [słabej mocy] w teście interakcji, a tym samym przypadkowego naruszenia założenia podejścia SS typu II; następnie przedstawiają podobne punkty do Myers & Well i odnotowują długą debatę na ten temat! ponownie wnioskuje o obecności interakcji na podstawie danych) z powodu problemu popełnienia błędu typu 2 [słabej mocy] w teście interakcji, a tym samym przypadkowego naruszenia założeń podejścia SS typu II; następnie przedstawiają podobne punkty do Myers & Well i odnotowują długą debatę na ten temat! ponownie wnioskuje o obecności interakcji na podstawie danych) z powodu problemu popełnienia błędu typu 2 [słabej mocy] w teście interakcji, a tym samym przypadkowego naruszenia założeń podejścia SS typu II; następnie przedstawiają podobne punkty do Myers & Well i odnotowują długą debatę na ten temat!
Tak więc moja interpretacja (i nie jestem ekspertem!) Jest taka, że po obu stronach argumentu jest dużo Wyższego Urzędu Statystycznego; że zwykłe wysuwane argumenty nie dotyczą zwykłej sytuacji, która spowodowałaby problemy (ta sytuacja jest powszechna w interpretacji głównych efektów przy nieistotnej interakcji); i że istnieją uzasadnione powody, aby martwić się podejściem typu II w tej sytuacji (i sprowadza się to do potęgi kontra potencjalnej kwestii nadmiernego liberalizmu).
Dla mnie to wystarczy, aby życzyć sobie opcji Type III w ezANOVA, a także Type II, ponieważ (za moje pieniądze) jest to doskonały interfejs do systemów ANOVA R. Moim zdaniem R jest łatwym w użyciu dla nowicjuszy, a pakiet „ez” z ezANOVA i dość uroczymi funkcjami kreślenia efektów znacznie przyczynia się do udostępnienia R bardziej ogólnej grupie badawczej. Niektóre z moich myśli w toku (i paskudny hack dla ezANOVA) są na stronie http://www.psychol.cam.ac.uk/statistics/R/anova.html .
Byłoby zainteresowane usłyszeć myśli wszystkich!