Przeprowadzam regresję logistyczną z wynikiem binarnym (start i start). Moja kombinacja predyktorów to zmienne ciągłe lub dychotomiczne.
Stosując podejście Box-Tidwell, jeden z moich ciągłych predyktorów potencjalnie narusza założenie liniowości logit. Ze statystyk dotyczących dobroci dopasowania nie wynika, że dopasowanie jest problematyczne.
Następnie ponownie uruchomiłem model regresji, zastępując pierwotną zmienną ciągłą: po pierwsze transformacją pierwiastkową, a po drugie dychotomiczną wersją zmiennej.
Po kontroli wyników wydaje się, że poprawność dopasowania nieznacznie się poprawia, ale reszty stają się problematyczne. Oszacowania parametrów, błędy standardowe i pozostają względnie podobne. Interpretacja danych nie zmienia się pod względem mojej hipotezy we wszystkich 3 modelach.
Dlatego pod względem użyteczności moich wyników i poczucia interpretacji danych właściwe wydaje się zgłoszenie modelu regresji przy użyciu oryginalnej zmiennej ciągłej.
Zastanawiam się nad tym:
- Kiedy regresja logistyczna jest odporna na potencjalne naruszenie liniowości założenia logit?
- Biorąc pod uwagę mój powyższy przykład, czy wydaje się akceptowalne włączenie oryginalnej zmiennej ciągłej do modelu?
- Czy istnieją jakieś odniesienia lub wskazówki dotyczące zalecania, gdy zadowalające jest zaakceptowanie, że model jest odporny na potencjalne naruszenie liniowości logit?