Mam zestaw danych, który zawiera zarówno zmienne jakościowe, jak i zmienne ciągłe. Poradzono mi, aby przekształcić zmienne kategorialne jako zmienne binarne dla każdego poziomu (tj. A_level1: {0,1}, A_level2: {0,1}) - Myślę, że niektórzy nazywają to „zmiennymi obojętnymi”.
Mając to na uwadze, czy wprowadzanie w błąd i wyśrodkowanie całego zestawu danych przy użyciu nowych zmiennych byłoby mylące? Wygląda na to, że straciłbym znaczenie zmiennych „on / off”.
Jeśli jest to mylące, czy to oznacza, że powinienem wyśrodkować i skalować zmienne ciągłe osobno, a następnie ponownie dodać je do mojego zbioru danych?
TIA