Załóżmy, że mam trzy populacje o czterech wzajemnie wykluczających się cechach. Pobieram losowe próbki z każdej populacji i tworzę tabelę krzyżową lub tabelę częstotliwości dla cech, które mierzę. Czy mam rację mówiąc, że:
Gdybym chciał sprawdzić, czy istnieje jakikolwiek związek między populacjami a cechami (np. Czy jedna populacja ma wyższą częstotliwość jednej z cech), powinienem przeprowadzić test chi-kwadrat i sprawdzić, czy wynik jest znaczący.
Jeśli test chi-kwadrat jest znaczący, pokazuje mi tylko, że istnieje pewna zależność między populacjami i cechami, ale nie sposób ich powiązania.
Ponadto nie wszystkie cechy muszą być związane z populacją. Na przykład, jeśli różne populacje mają znacząco różne rozkłady cech A i B, ale nie C i D, wówczas test chi-kwadrat może nadal powrócić jako znaczący.
Gdybym chciał zmierzyć, czy konkretna cecha wpływa populacji, to mogę przeprowadzić test na równych proporcjach (Widziałem ten nazywa się Z-test, lub jak
prop.test()
wR
) na tej właśnie cechy.
Innymi słowy, czy właściwe jest użycie parametru prop.test()
do dokładniejszego określenia charakteru relacji między dwoma zestawami kategorii, gdy test chi-kwadrat mówi, że istnieje znaczący związek?