Buduję model i myślę, że położenie geograficzne może być bardzo dobre w przewidywaniu zmiennej docelowej. Mam kod pocztowy każdego z moich użytkowników. Nie jestem jednak całkowicie pewien najlepszego sposobu włączenia kodu pocztowego jako funkcji predykcyjnej w moim modelu. Chociaż kod pocztowy jest liczbą, nic nie znaczy, jeśli liczba rośnie lub maleje. Mógłbym binaryzować wszystkie 30 000 kodów pocztowych, a następnie uwzględnić je jako funkcje lub nowe kolumny (np. {User_1: {61822: 1, 62118: 0, 62444: 0 itd.}}. Wydaje się jednak, że dodałoby to tonę funkcji do mojego modelu.
Jakieś pomysły na najlepszy sposób poradzenia sobie z tą sytuacją?