Dopasowuję krokową regresję logistyczną dla zestawu danych w SPSS. W procedurze dopasowuję mój model do losowego podzbioru, który jest ok. 60% całej próby, co stanowi około 330 przypadków.
Interesujące jest dla mnie to, że za każdym razem, gdy ponownie próbkuję moje dane, pojawiają się różne zmienne w końcowym modelu. Kilka predyktorów jest zawsze obecnych w ostatecznym modelu, ale inne pojawiają się i znikają w zależności od próbki.
Moje pytanie brzmi: Jaki jest najlepszy sposób, aby sobie z tym poradzić? Miałem nadzieję zobaczyć zbieżność zmiennych predykcyjnych, ale tak nie jest. Niektóre modele mają znacznie bardziej intuicyjny sens z perspektywy operacyjnej (i byłyby łatwiejsze do wyjaśnienia decydentom), a inne nieco lepiej pasują do danych.
Krótko mówiąc, skoro zmienne tasują się wokoło, jak poleciłbyś poradzić sobie z moją sytuacją?
Z góry bardzo dziękuję.