TŁO: Pomiń bezpiecznie - jest tutaj w celach informacyjnych i uzasadnia pytanie.
Otwarcie tego artykułu brzmi:
„Słynny test przygodności chi-kwadrat Karla Pearsona pochodzi z innej statystyki, zwanej statystyką z, opartej na rozkładzie normalnym. Najprostsze wersje mogą być matematycznie identyczne z równoważnymi testami z. Testy dają taki sam wynik we wszystkich okolicznościach. Dla wszystkich celów i celów „chi-kwadrat” można by nazwać „z-kwadrat”. Wartości krytyczne dla jednego stopnia swobody są kwadratem odpowiednich wartości krytycznych z. ”
Zostało to wielokrotnie potwierdzone w CV ( tutaj , tutaj , tutaj i innych).
I rzeczywiście możemy udowodnić, że jest równoważne z :
Powiedzmy, że i że i znajdź gęstość za pomocą metody :
. Problem polega na tym, że nie możemy zintegrować w ścisłej postaci gęstości rozkładu normalnego. Ale możemy to wyrazić:
Ponieważ wartości normalnego są symetryczne:
pdfxpdf√ . Zrównanie tego z normalnego (teraz w będzie aby być podłączonym do części normalnego ); i pamiętając o dołączeniu na końcu : e - x 2 pdf1
Porównaj z pdf kwadratu chi:
Ponieważ , dla df uzyskaliśmy dokładnie kwadratu chi. 1pdf
Ponadto, jeśli wywołamy funkcję prop.test()
w R , wywołujemy ten sam test jak gdybyśmy zdecydowali .chisq.test()
PYTANIE:
Dostaję więc wszystkie te punkty, ale wciąż nie wiem, jak odnoszą się one do faktycznej implementacji tych dwóch testów z dwóch powodów:
Test Z nie jest podniesiony do kwadratu.
Rzeczywiste statystyki testów są zupełnie inne:
Wartość statystyki testowej dla wynosi:
gdzie
= skumulowana statystyka testu Pearsona, która asymptotycznie zbliża się do . = liczba obserwacji typu ; = całkowita liczba obserwacji; = = oczekiwana (teoretyczna) częstotliwość typu , potwierdzona hipotezą zerową, że ułamek typu w populacji wynosi ; = liczba komórek w tabeli.
Z drugiej strony statystyka testu dla testu wynosi:
z , gdzie i to liczba „sukcesów” w stosunku do liczby przedmiotów na każdym z poziomów kategorii zmienne, tj. i .
Ta formuła wydaje się opierać na rozkładzie dwumianowym.
Te dwie statystyki testów są wyraźnie różne i dają różne wyniki dla faktycznych statystyk testu, a także dla wartości p : 5.8481
dla i dla testu z, gdzie ( dziękuję, @ mark999). Wartość p dla wynosi , podczas gdy dla testu z jest . Różnica wyjaśniona przez dwustronne versus jednostronne: (dziękuję @amoeba).2.4183
0.01559
0.0077
Więc na jakim poziomie mówimy, że są jednym i tym samym?
chisq.test()
, próbowałeś używać correct=FALSE
?