Aktualizacja 2018!
Możesz utworzyć przestrzeń osadzania (gęsty wektor) dla swoich zmiennych kategorialnych. Wielu z was zna word2vec i fastext, które osadzają słowa w znaczącej, gęstej przestrzeni wektorowej. Ten sam pomysł tutaj - twoje zmienne kategorialne zostaną zmapowane na wektor o pewnym znaczeniu.
Z artykułu Guo / Berkhahn :
Osadzanie jednostek nie tylko zmniejsza zużycie pamięci i przyspiesza sieci neuronowe w porównaniu z kodowaniem na gorąco, ale co ważniejsze, odwzorowując podobne wartości blisko siebie w przestrzeni osadzania, ujawnia nieodłączne właściwości zmiennych kategorialnych. Z powodzeniem zastosowaliśmy go w ostatnim konkursie Kaggle i mogliśmy osiągnąć trzecią pozycję dzięki stosunkowo prostym funkcjom.
Autorzy stwierdzili, że reprezentacja zmiennych kategorialnych w ten sposób poprawiła efektywność wszystkich testowanych algorytmów uczenia maszynowego, w tym losowego lasu.
Najlepszym przykładem może być zastosowanie techniki Pinteresta do grupowania powiązanych Pinów:
Ludzie w fastai wdrożyli kategoryczne osadzanie i stworzyli bardzo fajny post na blogu z towarzyszącym notatnikiem demo .
Dodatkowe informacje i objaśnienia
Sieć neuronowa służy do tworzenia osadzeń, tj. Przypisuje wektor do każdej wartości jakościowej. Po uzyskaniu wektorów można ich używać w dowolnym modelu, który akceptuje wartości liczbowe. Każdy element wektora staje się zmienną wejściową. Na przykład, jeśli użyjesz wektorów 3-D, aby osadzić kategoryczną listę kolorów, możesz otrzymać coś takiego: czerwony = (0, 1,5, -2,3), niebieski = (1, 1, 0) itd. Użyłbyś trzech zmienne wejściowe w losowym lesie odpowiadające trzem składnikom. W przypadku rzeczy czerwonych c1 = 0, c2 = 1,5, a c3 = -2,3. Dla rzeczy niebieskich c1 = 1, c2 = 1, a c3 = 0.
W rzeczywistości nie musisz używać sieci neuronowej do tworzenia osadzeń (chociaż nie polecam unikania tej techniki). Jeśli to możliwe, możesz tworzyć własne osadzenia ręcznie lub w inny sposób. Kilka przykładów:
- Odwzoruj kolory na wektory RGB.
- Mapuj lokalizacje do wektorów lat / long.
- W amerykańskim modelu politycznym odwzoruj miasta na niektóre elementy wektorowe reprezentujące wyrównanie do lewej / prawej, obciążenia podatkowe itp.