Muszę wykonać binarną regresję logistyczną z wieloma niezależnymi zmiennymi. Większość z nich ma charakter binarny, ale kilka zmiennych kategorialnych ma więcej niż dwa poziomy.
Jaki jest najlepszy sposób radzenia sobie z takimi zmiennymi?
Na przykład, dla zmiennej o trzech możliwych wartościach, przypuszczam, że należy utworzyć dwie zmienne fikcyjne. Następnie, w procedurze regresji krokowej, lepiej jest przetestować obie zmienne fikcyjne jednocześnie lub przetestować je osobno?
Będę używać SPSS, ale nie pamiętam go zbyt dobrze, więc: jak SPSS radzi sobie z tą sytuacją?
Co więcej, w przypadku porządkowej zmiennej kategorialnej dobrze jest użyć zmiennych zastępczych, które odtwarzają skalę porządkową? (Na przykład, przy użyciu trzech zmiennych binarnych dla 4-stan zmienną porządkową umieścić 0-0-0na poziomie , na poziomie , na poziomie 3 i na poziomie 4 , zamiast , , a na 4 poziomach).21-0-01-1-041-1-10-0-01-0-00-1-00-0-1