Przegląd ograniczonych maszyn Boltzmann
Ograniczona maszyna Boltzmanna (RBM) jest modelem generatywnym , który uczy się rozkładu prawdopodobieństwa na wejściu. Oznacza to, że po przeszkoleniu RBM może generować nowe próbki na podstawie wyuczonego rozkładu prawdopodobieństwa. Rozkład prawdopodobieństwa w obrębie widocznych jednostek jest określony przez
gdzie
a jest funkcją sigmoid, jest odchylenie dla widocznego węzła , a to waga od dov
p(v∣h)=∏i=0Vp(vi∣h),
p(vi∣h)=σ(ai+∑j=0Hwjihj)
σaiiwjihjvi. Z tych dwóch równań wynika, że zależy tylko od ukrytych stanów . Oznacza to, że informacja o tym, jak generowana jest widoczna próbka , musi być przechowywana w ukrytych jednostkach, wagach i błędach.
p(v∣h)hv
Używanie KMS do klasyfikacji
Korzystając z KMS do zadań klasyfikacyjnych, korzystasz z następującego pomysłu: ponieważ informacje o tym, jak wygenerowano dane treningowe lub testowe, są zapisywane w ukrytych jednostkach , możesz wyodrębnić te podstawowe czynniki, wprowadzając próbkę szkoleniową do widoczne jednostki RBM, propaguj je do jednostek ukrytych i użyj tego wektora jednostek ukrytych jako wektora cech. Nie wykonujesz już żadnego przejścia do widocznych jednostek.h
Ten ukryty wektor jest tylko przekształconą wersją danych wejściowych - nie jest w stanie samodzielnie sklasyfikować niczego. Aby dokonać klasyfikacji, trenowałbyś dowolny klasyfikator (klasyfikator liniowy, SVM, sieć neuronowa ze sprzężeniem zwrotnym lub cokolwiek innego) z ukrytym wektorem zamiast „surowych” danych treningowych jako danych wejściowych.
Jeśli budujesz sieć głębokiej wiary (DBN) - która była używana do wstępnego trenowania głębokich sieci neuronowych ze sprzężeniem zwrotnym w sposób nienadzorowany - wziąłbyś ten ukryty wektor i wykorzystał go jako dane wejściowe do nowego RBM, który układasz w stos na górze tego. W ten sposób możesz trenować sieć warstwa po warstwie, aż osiągnie pożądany rozmiar, bez potrzeby oznaczania danych. Na koniec dodasz np. Warstwę softmax na górę i wyszkolisz całą sieć z propagacją wsteczną w zadaniu klasyfikacyjnym.