Jak działa test chi-kwadrat Pearsona

Po ostatnim głosowaniu w dół próbowałem sprawdzić swoje zrozumienie testu Pearson Chi Squared. Zwykle używam statystyki chi kwadrat (lub zredukowanej statystyki chi kwadrat) do dopasowania lub sprawdzenia wynikowego dopasowania. W tym przypadku wariancja nie jest zwykle oczekiwaną liczbą zliczeń w tabeli lub histogramie, ale pewną wariancją określoną eksperymentalnie. Tak czy inaczej, zawsze miałem wrażenie, że test nadal wykorzystuje asymptotyczną normalność wielomianowego pliku PDF (tj. Moja statystyka testu to

Q = (n - N m)^{⊤} V^{- 1} (n - N m)

$Q = (n-Nm)^\top V^{-1}(n-Nm)$

i jest asymptotycznie wielomianowy, gdzie oznacza macierz kowariancji). Dlatego ma rozkład chi-kwadrat o dużej więc użycie oczekiwanej liczby zliczeń, ponieważ mianownik w statystyce staje się ważny dla dużej . Możliwe, że dotyczy to tylko histogramów, od lat nie analizowałem małej tabeli danych. $(n-Nm)$ $V$ $Q$ $n$ $n$

Czy brakuje mi bardziej subtelnego argumentu, którego mi brakuje? Byłbym zainteresowany referencją, a jeszcze lepiej krótkim wyjaśnieniem. (Chociaż jest to możliwe, właśnie głosowałem za pominięciem słowa asymptotycznego, co, jak przyznam, jest raczej ważne).

chi-squared histogram

— Melonik
źródło

W związku z tym przypuszczalnie prawdą jest również to, że można zastosować dokładnie ten sam test z dowolnymi normalnie dystrybuowanymi danymi. Gdybym miał użyć woltomierza, o którym wiedziałem, że ma jakiś normalnie rozłożony błąd, który ustaliłem, mógłbym użyć,

χ^{2} = \sum_{i} \frac{(V_{o b s} - V_{e x p})^{2}}{σ^{2}}

$\chi^{2} = \sum_{i} \frac{(V_{obs} - V_{exp})^{2}}{\sigma^{2}}$ . Czy to prawda? Statystyka zredukowanego chi-kwadrat prawdopodobnie opiera się na tym fakcie.

— Bowler

Test chi-kwadrat ma na celu analizę danych kategorycznych. Oznacza to, że dane zostały policzone i podzielone na kategorie. Nie będzie działać z danymi parametrycznymi lub ciągłymi. Więc nie działa ustalenie dopasowania wynikowego w każdym przypadku.

Źródło: http://www.ling.upenn.edu/~clight/chisquared.htm

— BradHanks
źródło

Witamy na tej stronie! Nie jestem pewien, czy rozumiem, w jaki sposób odnosi się to do omawianego pytania. Czy mógłbyś trochę rozszerzyć tę odpowiedź, pamiętając, że ten wątek prawdopodobnie bardziej dotyczy testu dobroci dopasowania niż analizy dwustronnych tabel awaryjnych?

— chl

Być może źle zrozumiałem pytanie, ale zastanawiałem się, czy test chi-kwadrat był odpowiedni w tym przykładzie. Mogę być trochę zardzewiały ...

— BradHanks

χ^{2}

$\chi^2$

χ^{2}

$\chi^2$