Muszę wykonać binarną regresję logistyczną z wieloma niezależnymi zmiennymi. Większość z nich ma charakter binarny, ale kilka zmiennych kategorialnych ma więcej niż dwa poziomy.
Jaki jest najlepszy sposób radzenia sobie z takimi zmiennymi?
Na przykład, dla zmiennej o trzech możliwych wartościach, przypuszczam, że należy utworzyć dwie zmienne fikcyjne. Następnie, w procedurze regresji krokowej, lepiej jest przetestować obie zmienne fikcyjne jednocześnie lub przetestować je osobno?
Będę używać SPSS, ale nie pamiętam go zbyt dobrze, więc: jak SPSS radzi sobie z tą sytuacją?
Co więcej, w przypadku porządkowej zmiennej kategorialnej dobrze jest użyć zmiennych zastępczych, które odtwarzają skalę porządkową? (Na przykład, przy użyciu trzech zmiennych binarnych dla 4-stan zmienną porządkową umieścić 0-0-0
na poziomie , na poziomie , na poziomie 3 i na poziomie 4 , zamiast , , a na 4 poziomach).21-0-0
1-1-0
41-1-1
0-0-0
1-0-0
0-1-0
0-0-1