Mam zamiar oprzeć moją odpowiedź ogólnie i wstawić komentarze, w jaki sposób twój problem pasuje do środowiska testowego. Ogólnie rzecz biorąc, możemy sprawdzić równość proporcji za pomocą gdzie typowa hipoteza , , jest następująca:χ2H0
H0:p1=p2=...=pk
tzn. wszystkie proporcje są sobie równe. Teraz w twoim przypadku hipoteza zerowa jest następująca:
H0:p1=p2=p3
a alternatywną hipotezą jest
HA: at leat one pi is different for i=1,2,3
Teraz, aby przeprowadzić test , musimy obliczyć następującą statystykę testową: Wartość statystyki testowej wynosiχ2
χ2=∑i=1n(Oi−Ei)2Ei
gdzie
- χ2 = Pearsona łączny statystyka testowa, która zbliża się asymptotycznie rozkładuχ2
- Oi = obserwowana częstotliwość
- Ei = oczekiwana (teoretyczna) częstotliwość, potwierdzona hipotezą zerową
- n = liczba komórek w tabeli
W twoim przypadku ponieważ możemy uznać ten problem za następującą tabelę:
n=6
Teraz, gdy mamy już statystyki testowe, mamy dwie opcje, jak przejść do zakończenia testowania hipotez.
Opcja 1) Możemy porównać nasz test statyczny z odpowiednią wartością krytyczną w ramach hipotezy zerowej. To znaczy, jeśli jest prawdziwe, to statystyka z tabeli kontyngencji z wierszami i kolumnami powinna mieć z stopni wolność. Po obliczeniu naszej wartości krytycznej jeśli mamy to wówczas odrzucimy hipotezę zerową. Oczywiście, jeśli to nie odrzucimy hipotezy zerowej. χ2H0χ2RCχ2(R−1)×(C−1)χ∗χ2>χ∗χ2≤χ∗
Graficznie (wszystkie liczby są złożone) wygląda to następująco:
Z wykresu, jeśli nasza statystyka testowa odpowiada niebieskiej statystyce testowej, nie odrzucilibyśmy hipotezy zerowej, ponieważ ta statystyka testowa nie mieści się w obszarze krytycznym (tj. ). Alternatywnie, zielona statystyka testowa mieści się w obszarze krytycznym, dlatego odrzucilibyśmy hipotezę zerową, gdybyśmy obliczyli statystykę zielonego testu.χ2χ2<χ∗
W twoim przykładzie twoje stopnie swobody są równe
df=(R−1)×(C−1)=(2−1)×(3−1)=1×2=2
Opcja 2) możemy obliczyć wartość p związaną ze statystyką testową w ramach hipotezy zerowej, a jeśli ta wartość p jest mniejsza niż określony poziom , możemy odrzucić hipotezę zerową. Jeśli wartość p jest większa niż poziom wówczas nie odrzucamy hipotezy zerowej. Zauważ, że wartość p jest prawdopodobieństwem, że jest większy niż statystyka testowa.ααχ2(R−1)×(C−1)
Graficznie to mamy
gdzie wartość p jest obliczana jako obszar większy niż nasza statystyka testowa (niebieski obszar zacieniowany w przykładzie).
Jeśli więc nie odrzuci hipotezy zerowej , w przeciwnym razieα>p-valueH0
jeśli odrzuca hipotezę zerowąα≤p-valueH0