Cześć, mam ramkę danych z dużymi wartościami kategorialnymi ponad 1600 kategorii. Czy mogę znaleźć alternatywy, aby nie mieć ponad 1600 kolumn.
Znalazłem to poniżej ciekawy link http://amunategui.github.io/feature-hashing/#sourcecode
Ale konwertują na klasę / obiekt, którego nie chcę. Czy chcę, aby końcowy wynik był ramką danych, aby móc testować za pomocą różnych modeli uczenia maszynowego? czy jest jakiś sposób, w jaki mogę wykorzystać genetyczną matrycę do szkolenia innych modeli uczenia maszynowego innych niż regresja logistyczna lub XGBoost?
Czy mogę coś zaimplementować?