@jbowman dał ci dobrą opcję. Myślałem, że mogę podać kilka informacji na temat swoich wyraźnych pytań o stosowności -test vs. testu. χ 2zχ2
z -test:
Istnieją dwa obawy co do stosowności używając -test, zarówno czasowo, czy zakłada dystrybucję próbek jest poprawna. Po pierwsze, test- używa rozkładu normalnego zamiast rozkładu- , co oznacza, że odchylenia standardowe są znane bez błędu próbkowania. Po drugie, rozkład próbkowania jest ciągły, ale dane są dyskretne; ponieważ możliwe są tylko niektóre kombinacje danych, możliwe są tylko pewne uzyskane wartości statystyki testowej, które mogą nie odpowiadać teoretycznemu rozkładowi próbkowania. (Omawiam ten problem w kontekście innych testów tutaj: Porównywanie i kontrastowanie, wartości p, poziomy istotności i błąd typu I. ) zzt
Rozważmy pierwszą kwestię w innym kontekście. Jeśli masz dwie grupy z normalnie rozłożonymi danymi i chcesz sprawdzić, czy średnie są równoważne, musisz obliczyć zarówno średnie, jak i odchylenia standardowe. Teraz wiemy, że środki są narażone na błąd próbkowania, dlatego musimy wykonać test, a nie tylko powiedzieć, że te dwa średnie próbki nie są identyczne. Jednak nasze szacunki odchyleń standardowych również muszą być obarczone błędem próbkowania i musimy w jakiś sposób wziąć to pod uwagę. Kiedy to robimy, okazuje się, że statystyka testowa (rodzaj skalowanej średniej różnicy) jest rozkładana jako . Jeśli zamiast tego użyjemy rozkładu normalnego (tj.tz-test), oznaczałoby to, że zakładamy, że nasze szacunki odchyleń standardowych są bezbłędne - idealne. Więc dlaczego z ewentualnego -test być stosowany w przypadku? Powodem jest to, że twoje dane są dwumianowe (tj. Liczba „sukcesów” ze znanej sumy „prób”), a nie normalne. W rozkładzie dwumianowym odchylenie standardowe jest funkcją średniej, więc po oszacowaniu średniej nie ma dodatkowej niepewności, o którą trzeba się martwić. Zatem rozkład normalny może być wykorzystany jako model rozkładu próbkowania statystyki testowej. z
Chociaż użycie rozkładu normalnego do zrozumienia długoterminowego zachowania statystyki testowej jest technicznie poprawne, pojawia się inny problem. Problem polega na tym, że rozkład normalny jest ciągły, ale ponieważ dane są dyskretne, nie wszystkie wartości w rozkładzie teoretycznym można znaleźć w zbiorze danych. (Znowu omówić ten problem w znacznie bardziej szczegółowo w wyżej połączonej odpowiedzi.) Na szczęście, mecz pomiędzy możliwych wyników swoich danych oraz teoretycznego rozkładu normalnego próbkowania lepiej tym większy . W twoim przypadku, niezależnie od prawdziwych prawdopodobieństw leżących u podstaw, możesz osiągnąć tyle samo sukcesów, albo tak mało jak w każdej grupie. Oznacza to, że liczba możliwych kombinacji wynosiN91×91=1,729, co daje wiele możliwości. Przy małym zestawie danych naprawdę możesz napotkać niektóre rodzaje problemów, które omawiam w mojej połączonej odpowiedzi, ale przy nie musisz się zbytnio przejmować. Wierzę, że -test był ważny wybór dla badaczy. N=180z
χ2 -test:
Ale co z testem ? Myślę, że to również słuszny wybór, ale nie byłby to mój pierwszy wybór. (Pragnę zauważyć, że drugi problem omówiony powyżej - niedopasowanie między danymi dyskretnymi a ciągłym rozkładem odniesienia - dotyczy tak samo jak i testu , więc istnieje tutaj nie ma przewagi). Problem zχ2χ2zχ2-test polega na tym, że nie zakłada się, że istnieje coś specjalnego w sumach kolumn w stosunku do sum wierszy; oba są traktowane tak, jakby mogły być innymi możliwymi wartościami. Nie odzwierciedla to jednak dokładnie konfiguracji eksperymentalnej. Było 180 osób, a do każdej grupy przydzielono 90 osób. Jedyną rzeczą, która naprawdę różni się w powtarzanych identycznych badaniach, jest liczba osób, które przeziębiły się w każdej grupie. -test niepoprawny traktuje zarówno liczba przeziębień i liczba osób w każdej grupie tak, jakby mogli zmianie, ale -test uzależnia prawo założenie. Dlatego -test ma większą moc tutaj. χ2zz
Co do wartości, test permutacji sugerowany przez @jbowman również dobrze uwzględnia ten aspekt twojego projektu i nie cierpi z powodu dyskretnego ciągłego niedopasowania. Jest to zatem najlepsza opcja. Pomyślałem jednak, że możesz chcieć dowiedzieć się nieco więcej o porównaniu testów i w twojej sytuacji. zχ2