Nie wiem, czy jest to powszechna / najlepsza praktyka, ale jest to inny punkt widzenia tej sprawy.
Jeśli masz, powiedzmy, datę, możesz traktować każde pole jako „zmienną kategorii” zamiast „zmiennej ciągłej”. Dzień miałby wartość z zestawu {1, 2 ..., 31}, miesiąc miałby wartość z {1, ..., 12}, a dla roku wybrałeś wartość minimalną i maksymalną i zbuduj zestaw.
Następnie, ponieważ określone wartości liczbowe dni, miesięcy i lat mogą nie być przydatne do znajdowania trendów w danych, użyj reprezentacji binarnej, aby zakodować wartości liczbowe, z których każda jest funkcją. Na przykład miesiącem 5 będzie 0 0 0 0 1 0 0 0 0 0 0 0
(11 0 to 1 na 5 pozycji, każdy bit jest cechą).
Tak więc, mając na przykład 10 lat w „zestawie roku”, data zostałaby przekształcona w wektor 43 cech (= 31 + 12 + 10). Przy użyciu „rzadkich wektorów” ilość funkcji nie powinna stanowić problemu.
Coś podobnego można zrobić dla danych dotyczących czasu, dnia tygodnia, dnia miesiąca ...
Wszystko zależy od pytania, na które ma odpowiedzieć model uczenia maszynowego.