Czy możesz podać powód zastosowania testu jednostronnego w teście analizy wariancji?
Dlaczego stosujemy test jednostronny - test F - w ANOVA?
Czy możesz podać powód zastosowania testu jednostronnego w teście analizy wariancji?
Dlaczego stosujemy test jednostronny - test F - w ANOVA?
Odpowiedzi:
Testy F są najczęściej używane do dwóch celów:
w ANOVA, do testowania równości średnich (i różnych podobnych analiz); i
w testowaniu równości wariancji
Rozważmy kolejno:
1) Testy F w ANOVA (i podobnie, zwykłe rodzaje testów chi-kwadrat dla danych zliczania) są konstruowane tak, że im bardziej dane są zgodne z alternatywną hipotezą, tym większa jest statystyka testu, podczas gdy układ próbek dane, które wyglądają najbardziej spójnie z wartością null, odpowiadają najmniejszym wartościom statystyki testowej.
Rozważ trzy próbki (o wielkości 10, z jednakową wariancją próbki) i ustaw je tak, aby miały równe średnie próbki, a następnie przesuwaj je według różnych wzorów. Gdy zmienność próbki oznacza wzrost od zera, statystyka F staje się większa:
Czarne linie ( ) to wartości danych. Ciężkie czerwone linie ( ) oznaczają środki grupy.|
Gdyby hipoteza zerowa (równość średnich populacji) była prawdziwa, można by oczekiwać pewnej zmienności średnich próbek i zwykle można oczekiwać, że współczynniki F z grubsza wynoszą około 1. Mniejsze statystyki F wynikają z próbek, które są bliżej siebie niż zwykle spodziewaj się ... więc nie zamierzasz dojść do wniosku, że populacja różni się.
To znaczy, dla ANOVA, odrzucisz hipotezę równości średnich, gdy uzyskasz niezwykle duże wartości F, i nie odrzucisz hipotezy równości średnich, gdy uzyskasz niezwykle małe wartości (może to oznaczać coś , ale nie że populacja oznacza różne).
Oto ilustracja, która może pomóc ci zobaczyć, że chcemy odrzucić tylko, gdy F znajduje się w górnym ogonie:
2) Testy F dla równości wariancji * (w oparciu o współczynniki wariancji). Tutaj stosunek dwóch oszacowań wariancji próbki będzie duży, jeśli wariancja próbki licznika jest znacznie większa niż wariancja w mianowniku, a stosunek będzie mały, jeśli wariancja próbki mianownika będzie znacznie większa niż wariancja w liczniku.
Oznacza to, że w celu przetestowania, czy stosunek wariancji populacji różni się od 1, należy odrzucić wartość zerową zarówno dla dużych, jak i małych wartości F.
* (Pomijając kwestię wysokiej wrażliwości na dystrybucyjne założenie tego testu (istnieją lepsze alternatywy), a także kwestię, że jeśli jesteś zainteresowany stosownością założeń równości wariancji ANOVA, twoja najlepsza strategia prawdopodobnie nie jest test formalny.)
Należy zrozumieć, że celem ANOVA jest sprawdzenie, czy istnieją nierówności w środkach ... co oznacza, że mamy do czynienia z dużymi różnicami między próbkami (a zatem średnimi, ponieważ zmiany są obliczane ze średnich) w porównaniu z różnicami w próbkach (ponownie obliczony na podstawie średniej dla pojedynczej próbki). Kiedy różnice między próbkami są małe (co powoduje, że wartość F znajduje się po lewej stronie), nie ma to znaczenia, ponieważ różnica ta jest nieznaczna. Różnice między próbkami mają znaczenie, jeśli są znacznie wyższe niż zmiany wewnątrz, w takim przypadku wartość F byłaby większa niż 1, a zatem w prawym ogonie.
Pozostaje tylko pytanie, dlaczego umieścić cały poziom znaczenia w prawym ogonie, a odpowiedź jest znowu podobna. Odrzucenie następuje tylko wtedy, gdy współczynnik F znajduje się po prawej stronie i nigdy, gdy współczynnik F znajduje się po lewej stronie. Poziom istotności jest miarą błędu wynikającego z ograniczeń statystycznych. Ponieważ odrzucenie następuje tylko po prawej stronie, cały poziom istotności (ryzyko błędu błędnej konkluzji) jest utrzymany po prawej stronie. `
Oczekiwaną wartością średniego kwadratu (MS) w ramach leczenia jest wariancja populacyjna, podczas gdy oczekiwaną wartością dla MS między traktowaniami jest wariancja populacyjna PLUS wariancja leczenia. Zatem stosunek F = MSbetween / MSwithin jest zawsze większy niż 1 i nigdy nie mniejszy niż 1.
Ponieważ dokładność testu jednostronnego jest lepsza niż testu dwustronnego, wolimy zastosować test jednostronny.