Jaka jest różnica w kontekście uczenia maszynowego
- uczenie się bez nadzoru
- nadzorowane uczenie się i
- częściowo nadzorowane uczenie się?
Jakie są niektóre z głównych podejść algorytmicznych?
Jaka jest różnica w kontekście uczenia maszynowego
Jakie są niektóre z głównych podejść algorytmicznych?
Odpowiedzi:
Zasadniczo problemy uczenia maszynowego można uznać za warianty szacowania funkcji do celów klasyfikacji, prognozowania lub modelowania.
W nadzorowanym uczeniu się wyposaża się w dane wejściowe ( , , ...,) i wyjściowe ( , , ...,) i napotyka się trudności ze znalezieniem funkcji, która przybliża to zachowanie w uogólniony sposób. Wynikiem może być etykieta klasy (w klasyfikacji) lub liczba rzeczywista (w regresji) - są to „nadzór” w uczeniu nadzorowanym.
W przypadku uczenia się bez nadzoru , w przypadku podstawowym otrzymujesz dane wejściowe , , ..., ale nie zapewniasz docelowych wyników ani nagród z jego środowiska. W zależności od problemu (sklasyfikuj lub przewiduj) i swojej podstawowej wiedzy o próbkowanej przestrzeni, możesz użyć różnych metod: szacowanie gęstości (szacowanie niektórych podstawowych plików PDF do prognozowania), k-średnie grupowanie (klasyfikowanie nieoznakowanych danych o wartościach rzeczywistych), k- grupowanie trybów (klasyfikowanie nieznakowanych danych kategorialnych) itp.
Uczenie częściowo nadzorowane obejmuje oszacowanie funkcji na danych oznakowanych i nieznakowanych. Podejście to jest motywowane faktem, że generowanie danych na etykietach jest często kosztowne, podczas gdy dane nieoznaczone na ogół nie. Wyzwanie tutaj polega głównie na pytaniu technicznym, jak traktować dane mieszane w ten sposób. Zobacz tę ankietę dotyczącą częściowo nadzorowanego uczenia się, aby uzyskać więcej informacji na temat częściowo nadzorowanych metod uczenia się.
Oprócz tych rodzajów uczenia się, istnieją inne, takie jak uczenie zbrojenia przy czym metoda uczenia współdziała z jego środowiska poprzez działania produkujących , ,. . .. które dają nagrody lub kary , , ...
Uczenie się bez nadzoru
Uczenie się bez nadzoru odbywa się wtedy, gdy nie ma dostępnych danych do szkolenia. Przykładami tego są często metody grupowania.
Nadzorowana nauka
W takim przypadku dane treningowe istnieją na podstawie danych oznaczonych. Problem, który rozwiązujesz tutaj, to często przewidywanie etykiet dla punktów danych bez etykiety.
Nauka częściowo nadzorowana
W takim przypadku wykorzystywane są zarówno dane oznaczone, jak i dane nieznakowane. Można to na przykład wykorzystać w sieciach głębokiego przekonania, w których niektóre warstwy uczą się struktury danych (bez nadzoru), a jedna warstwa służy do klasyfikacji (przeszkolona z danymi nadzorowanymi)
Nie sądzę, że nadzorowany / bez nadzoru to najlepszy sposób, aby o tym myśleć. W przypadku eksploracji podstawowych danych lepiej jest pomyśleć o tym, co próbujesz zrobić. Istnieją cztery główne zadania:
Prognoza. jeśli przewidujesz liczbę rzeczywistą, nazywa się to regresją. jeśli przewidujesz liczbę całkowitą lub klasę, nazywa się to klasyfikacją.
modelowanie. modelowanie jest takie samo jak przewidywanie, ale model jest zrozumiały dla ludzi. Sieci neuronowe i maszyny wektorów wspierających działają świetnie, ale nie wytwarzają zrozumiałych modeli [1]. drzewa decyzyjne i klasyczna regresja liniowa są przykładami łatwych do zrozumienia modeli.
podobieństwo. jeśli próbujesz znaleźć naturalne grupy atrybutów, nazywa się to analizą czynnikową. jeśli próbujesz znaleźć naturalne grupy obserwacji, nazywa się to grupowaniem.
stowarzyszenie. to bardzo przypomina korelację, ale dla ogromnych binarnych zestawów danych.
[1] Najwyraźniej Goldman Sachs stworzył mnóstwo wielkich sieci neuronowych do przewidywania, ale potem nikt ich nie zrozumiał, więc musieli napisać inne programy, aby spróbować wyjaśnić sieci neuronowe.