Mam sklasyfikowane dane w tabeli 2 x 2 x 6. Nazwijmy wymiary response
, A
i B
. Dopasowuję regresję logistyczną do danych za pomocą modelu response ~ A * B
. Analiza dewiacji tego modelu wskazuje, że oba terminy i ich interakcja są znaczące.
Jednak patrząc na proporcje danych, wygląda na to, że tylko 2 poziomy B
odpowiadają za te znaczące efekty. Chciałbym sprawdzić, które poziomy są sprawcami. Obecnie moim podejściem jest wykonanie 6 testów chi-kwadrat na 2 x 2 tabelach response ~ A
, a następnie dostosowanie wartości p z tych testów dla wielu porównań (przy użyciu dopasowania Holma).
Moje pytanie brzmi, czy istnieje lepsze podejście do tego problemu. Czy istnieje bardziej zasadnicze podejście do modelowania lub wielokrotne porównywanie testów chi-kwadrat?