Nadzorowana nauka
- 1) Ludzka tworzy klasyfikator oparty na wejściowych i wyjściowych danych
- 2) Ten klasyfikator jest szkolony przy użyciu zestawu danych szkoleniowych
- 3) Ten klasyfikator jest testowany z testowym zestawem danych
- 4) Wdrożenie, jeśli wynik jest zadowalający
Do użycia, gdy: „Wiem, jak klasyfikować te dane, potrzebuję tylko ciebie (klasyfikatora), aby je posortować”.
Punkt metody: do klasyfikowania etykiet lub tworzenia liczb rzeczywistych
Uczenie się bez nadzoru
- 1) Człowiek buduje algorytm na podstawie danych wejściowych
- 2) Ten algorytm jest testowany z testowym zestawem danych (w którym algorytm tworzy klasyfikator)
- 3) Wdrożenie, jeśli klasyfikator jest zadowalający
Do użycia, gdy: „Nie mam pojęcia, jak sklasyfikować te dane, czy możesz (algorytm) stworzyć dla mnie klasyfikator?”
Punkt metody: Aby klasyfikować etykiety lub przewidywać (PDF)
Nauka wzmocnienia
- 1) Człowiek buduje algorytm na podstawie danych wejściowych
- 2) Ten algorytm przedstawia stan zależny od danych wejściowych, w których użytkownik nagradza lub karze algorytm poprzez działanie , które podjął algorytm, co trwa z czasem
- 3) Ten algorytm uczy się na podstawie nagrody / kary i sam się aktualizuje, to trwa
- 4) Zawsze jest produkowany, musi uczyć się prawdziwych danych, aby móc prezentować działania od stanów
Do użycia, gdy: „Nie mam pojęcia, jak sklasyfikować te dane, czy możesz sklasyfikować te dane, a dam ci nagrodę, jeśli jest poprawna, lub ukaram cię, jeśli nie jest”.
Czy jest to rodzaj przepływu tych praktyk, słyszę dużo o tym, co robią, ale praktyczne i przykładowe informacje są przerażająco małe!