Test G vs test chi-kwadrat Pearsona


10

Testuję niezależność w tabeli awaryjności Nie wiem, czy test G czy test chi-kwadrat Pearsona jest lepszy. Rozmiar próbki jest w setkach, ale istnieją pewne niskie liczby komórek. Jak stwierdzono na stronie Wikipedii , przybliżenie rozkładu chi-kwadrat jest lepsze dla testu G niż dla testu chi-kwadrat Pearsona. Ale używam symulacji Monte Carlo do obliczenia wartości p, więc czy jest jakaś różnica między tymi dwoma testami?N×M


Odpowiedzi:


8

Są asymptotycznie takie same. Są po prostu różnymi sposobami na uzyskanie tego samego pomysłu. Mówiąc dokładniej, test chi-kwadrat Pearsona jest testem punktacji, podczas gdy test G jest testem współczynnika prawdopodobieństwa. Aby lepiej zrozumieć te pomysły, pomocne może być przeczytanie mojej odpowiedzi tutaj: Dlaczego moje wartości p różnią się między wynikami regresji logistycznej, testem chi-kwadrat i przedziałem ufności dla OR? Aby odpowiedzieć na twoje bezpośrednie pytanie, jeśli obliczasz wartość p za pomocą symulacji Monte Carlo, nie powinno to mieć znaczenia; możesz użyć tej, która jest dla Ciebie wygodniejsza. Zauważ, że nie ma problemu z niską liczbą komórek, tylko (potencjalnie) niska oczekiwanaliczba komórek; możliwe jest posiadanie niskiej liczby komórek i oczekiwanie, że liczby będą w porządku. Co więcej, ani niskie rzeczywiste liczby, ani niskie oczekiwane liczby nie mają znaczenia, gdy wartość p jest określana na podstawie symulacji.

(Do tego, co jest warte, prawdopodobnie użyłbym chi-kwadrat Pearsona, ponieważ R ma do tego wygodną funkcję, która obejmuje opcję symulacji wartości p).


jaka jest funkcja w R?
llewmills

@llewmills, chisq.test.
gung - Przywróć Monikę


-1

Test chi-kwadrat i test G zwykle dają podobne wyniki. Ale najważniejsze jest to, że musisz wybrać jeden z dwóch testów i trzymać się go, nie tylko dla wspomnianego testu, ale dla przyszłych testów w trakcie badań. Jest to wskazane, ponieważ jeśli spróbujesz zastosować oba testy zamiennie, bardzo prawdopodobne jest, że zwiększysz szansę na uzyskanie fałszywie dodatniego wyniku.


2
Jakie jest uzasadnienie, według którego zwiększa się prawdopodobieństwo fałszywego pozytywu? (Chyba że masz zamiar zasugerować, że test jest wybierany przez odniesienie do faktycznych liczb - ale wtedy chodzi o odniesienie się do liczb do wyboru między nimi to jest problem, a nie pomysł potencjalnej zamiany testów per se)
Glen_b

2
@Glen_b Prawdopodobieństwo uzyskania fałszywego wyniku pozytywnego prawdopodobnie wzrośnie, jeśli wybierzemy wartość p testu, która jest bardziej korzystna dla naszych założeń (w przypadku, gdy wypróbujemy oba testy)
little_monster
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.