Test niezależności a test jednorodności

Uczę podstawowego kursu statystycznego i dziś obejmę test niezależności chi-kwadrat dla dwóch kategorii oraz test jednorodności. Te dwa scenariusze są koncepcyjnie różne, ale mogą wykorzystywać tę samą statystykę testową i rozkład. W teście jednorodności zakłada się, że krańcowe wartości dla jednej z kategorii są częścią samego projektu - reprezentują liczbę osobników wybranych dla każdej grupy eksperymentalnej. Ponieważ jednak test chi-kwadrat obraca się wokół warunkowania na wszystkich wartościach krańcowych, nie ma matematycznych konsekwencji rozróżnienia między testami jednorodności a testami niezależności z danymi kategorycznymi - przynajmniej nie, gdy stosuje się ten test.

Moje pytanie jest następujące: czy istnieje jakaś szkoła myśli statystycznej lub podejścia statystycznego, która dałaby różne analizy, w zależności od tego, czy testujemy niezależność (gdzie wszystkie marginesy są zmiennymi losowymi), czy test jednorodności (gdzie jeden zestaw marginesów jest określone przez projekt)?

W przypadku ciągłym powiedz, gdzie obserwujemy $(X,Y)$ na ten sam temat i sprawdź niezależność lub obserwuj $(X_1, X_2)$ w różnych populacjach i przetestować, czy pochodzą one z tego samego rozkładu, metoda jest inna (analiza korelacji vs test t). Co jeśli dane kategoryczne pochodzą z dyskretnych zmiennych ciągłych? Czy testy niezależności i jednorodności powinny być nie do odróżnienia?

— Placidia
źródło

Czy możesz podać źródło, które odróżnia „test jednorodności” i „test niezależności”? Kiedyś myślałem, że to samo (i Wikipedia też). Nazywa się to również testem asocjacji chi-kwadrat dla dwukierunkowej tabeli kontyngencji lub testem porównawczym chi-kwadrat próbek niezależnych od K. Nie należy go mylić z testem chi-kwadrat na jednej próbce, znanym również jako test zgodności chi-kwadrat . W nim testujemy obserwowane częstotliwości z teoretycznymi oczekiwanymi, które dostarczamy.

— ttnphns

@ttnphns To wydaje się być endemiczne. Używam „Spodziewaj się nieoczekiwanego” Raluca Balana i Gillesa Lamothea. W zeszłym roku wykładałem ze statystyki biznesowej Sharpe, De Veaux i in. Oba teksty stanowią spore wyróżnienie. W obu przypadkach mamy dwukierunkową tabelę awaryjności. Nie trzeba dodawać, że żaden podręcznik nie uważa, że warto uczyć wielkości efektu dla tabeli awaryjnej: kolejny przypadek, w którym subtelność triumfuje nad przydatnością w podstawowych kursach statystycznych.

— Placidia

Różnica powinna pojawić się, jeśli próbujesz uzyskać przedział ufności dla rozmiaru efektu.

— Ray Koopman,

Brzmi intrygująco. Czy masz coś przeciwko dodaniu pewnych szczegółów i uczynieniu z tego odpowiedzi?

— Placidia

To zależy, czy chcesz torturować uczniów, rozróżniając marginesy warunkowe / bezwarunkowe. Jeśli nie, możesz po prostu skoncentrować się na wyjaśnieniu, że „niezależność dwóch zmiennych kategorialnych” jest równoważne z „jednorodnością rozkładów warunkowych”, a następnie przedstawić pojedynczy

χ^{2}

$\chi^2$ -test. (Zazwyczaj prezentuję to wraz z niższymi granicami ufności dla prawdziwego Cramera

V

$V$ która mierzy siłę skojarzenia.)

— Michael M,

Odpowiedzi:

Musisz po prostu zadać sobie pytanie: „Jak napisać hipotezę zerową?”. Zastanów się $2 \times k$ Tabela awaryjności częstotliwości niektórych zachowań (t / n) wśród wielu $k$ grupy. Traktując pierwszą grupę jako odniesienie, masz $k-1$ iloraz szans ( $\theta_i, i = 1, 2, \ldots, k-1$ ), które opisują związek między częstotliwością a grupą.

Pod niezależnością, jak w przypadku jednorodności, zakładasz, że wszystkie iloraz szans wynosi 1. Oznacza to, że prawdopodobieństwo odpowiedzi „tak” na warunek jest równie prawdopodobne bez względu na przydział grupy. Jeśli te założenia zawiodą, co najmniej jedna grupa jest inna.

$\mathcal{H}_0(\mbox{homogeneity}): \sum_{i=1}^{k-1} |\theta_i| = 0$

$\mathcal{H}_0(\mbox{independence}): \sum_{i=1}^{k-1} |\theta_i| = 0$

Test ten można przeprowadzić za pomocą testu chi-kwadrat Pearsona z wykorzystaniem obserwowanych / oczekiwanych częstotliwości, który jest testem punktowym dla modelu regresji logistycznej dostosowującym się do $k-1$ zmienne wskaźnikowe dla członkostwa w grupie. Tak strukturalnie możemy powiedzieć, że te testy są takie same.

Różnice pojawiają się jednak, gdy weźmiemy pod uwagę charakter czynnika grupującego. W tym sensie ważne jest kontekstowe zastosowanie testu, a raczej jego nazwa. Grupa może bezpośrednio przyczyniać się do wyniku, takiego jak obecność lub brak wzoru genu lub allelu cechy, w którym to przypadku, odrzucając wartość zerową, dochodzimy do wniosku, że wynik zależy od rozpatrywanego czynnika grupującego.

Z drugiej strony, gdy testujemy jednorodność, zwalniamy się z dokonywania jakichkolwiek przyczynowych założeń. Tak więc, gdy „grupa” jest wyrafinowanym konstruktem, takim jak rasa (która powoduje i jest spowodowana uwarunkowaniami genetycznymi, behawioralnymi i społeczno-ekonomicznymi), możemy wyciągnąć wnioski, takie jak: „mniejszości rasowo-etniczne doświadczają różnic mieszkaniowych, o czym świadczy heterogeniczność wskaźnika deprywacji sąsiedztwa” . Jeśli ktoś odparł taki argument, mówiąc: „cóż, to dlatego, że mniejszości osiągają niższe wykształcenie, zarabiają niższe dochody i zyskują mniej zatrudnienia”, można powiedzieć: „Nie twierdziłem, że ich rasa spowodowała takie rzeczy, po prostu że jeśli spojrzysz podczas wyścigu możesz przewidywać ich stan życia. ”

W ten sposób testy zależności są szczególnym przypadkiem testów jednorodności, w których możliwy wpływ czynników czających się jest interesujący i należy się nim zająć w analizie warstwowej. Użycie dopasowania wielowymiarowego w analogicznym modelu regresji logistycznej osiąga coś takiego i nadal możemy powiedzieć, że przeprowadzamy test zależności, ale niekoniecznie jednorodności.

— AdamO
źródło

Istnieje wyraźna różnica między tymi dwoma problemami, jeśli zamodelujesz je w sposób bayesowski. W niektórych pracach pierwszy przypadek (jednorodność) nazywa się próbkowaniem z „ustalonym jednym marginesem”, a drugi przypadek (niezależność) jako „ustalony całkowity stół”. Spójrz na przykład na Casella i in. (JASA 2009) .
Pracuję nad tym tematem, ale mój artykuł - który również opisuje to rozróżnienie - nie został jeszcze opublikowany :)

— Emanuele
źródło

Istnieje również wyraźna różnica z perspektywy częstych - po prostu asymptotycznie nie ma to znaczenia, a argumenty często są uzależniane od jednego lub obu marginesów.

— Scortchi - Przywróć Monikę