Czy w odniesieniu do uczenia się bez nadzoru (takiego jak klastrowanie) istnieją jakieś wskaźniki pozwalające ocenić wydajność?
Czy w odniesieniu do uczenia się bez nadzoru (takiego jak klastrowanie) istnieją jakieś wskaźniki pozwalające ocenić wydajność?
Odpowiedzi:
W pewnym sensie myślę, że to pytanie jest niemożliwe do odpowiedzi. Mówię to, ponieważ to, jak dobrze sprawdza się konkretna metoda bez nadzoru, będzie w dużej mierze zależeć od tego, dlaczego w pierwszej kolejności odbywa się nauka bez nadzoru, tj. Czy metoda działa dobrze w kontekście celu końcowego? Oczywiście nie jest to do końca prawdą, ludzie pracują nad tymi problemami i publikują wyniki, które zawierają jakąś ocenę. Poniżej przedstawię kilka metod, które znam.
Dobrym zasobem (z odniesieniami) do klastrowania jest strona dokumentacji sklearn, Ocena wydajności klastrowania . Dotyczy to kilku metod, ale wszystkie oprócz jednego, Współczynnik sylwetki, zakładają, że dostępne są etykiety naziemne. Metodę tę wspomniano również w pytaniu Miara oceny klastrowania , powiązana z komentarzami do tego pytania.
Jeśli Twoja metoda uczenia się bez nadzoru jest probabilistyczna, inną opcją jest oszacowanie pewnej miary prawdopodobieństwa (prawdopodobieństwo logarytmiczne, zakłopotanie itp.) Na temat wstrzymanych danych. Motywacja polega na tym, że jeśli twoja metoda nauki bez nadzoru przypisuje wysokie prawdopodobieństwo do podobnych danych, które nie zostały użyte do dopasowania parametrów, prawdopodobnie wykonała dobrą robotę, przechwytując rozkład zainteresowania. Dziedziną, w której ten typ oceny jest powszechnie stosowany, jest modelowanie języka.
Ostatnią opcją, o której wspomnę, jest użycie nadzorowanego ucznia w powiązanym zadaniu pomocniczym. Jeśli Twoja metoda bez nadzoru wytwarza zmienne ukryte, możesz pomyśleć o tych zmiennych ukrytych jako reprezentacji danych wejściowych. Dlatego sensowne jest wykorzystanie tych ukrytych zmiennych jako danych wejściowych dla nadzorowanego klasyfikatora wykonującego pewne zadania związane z domeną, z której pochodzą dane. Wydajność metody nadzorowanej może następnie służyć jako surogat dla wydajności ucznia bez nadzoru. Jest to zasadniczo konfiguracja, którą widzisz w większości prac nad uczeniem się reprezentacji.
Ten opis jest prawdopodobnie trochę mglisty, więc dam konkretny przykład. Prawie cała praca nad uczeniem się reprezentacji słów wykorzystuje następujące podejście do oceny:
Przykład takiego podejścia można znaleźć w artykule Szkolenie ograniczone Maszyny Boltzmanna w zakresie obserwacji słownych przez Dahla i in.