Dogłębne uczenie się a drzewa decyzyjne i metody wspomagające


18

Szukam prac lub tekstów, które porównują i omawiają (empirycznie lub teoretycznie):

z

Mówiąc dokładniej, czy ktoś wie o tekście omawiającym lub porównującym te dwa bloki metod ML pod względem szybkości, dokładności lub zbieżności? Poszukuję również tekstów, które wyjaśniają lub podsumowują różnice (np. Wady i zalety) między modelami lub metodami w drugim bloku.

Wszelkie wskazówki lub odpowiedzi dotyczące takich porównań byłyby bardzo mile widziane.

Odpowiedzi:


1

Czy możesz bardziej szczegółowo określić rodzaje danych, na które patrzysz? To częściowo określi, jaki typ algorytmu zbiega się najszybciej.

Nie jestem też pewien, jak porównać metody takie jak boosting i DL, ponieważ boosting to tak naprawdę zbiór metod. Z jakich innych algorytmów korzystasz przy doładowaniu?

Ogólnie techniki DL można opisać jako warstwy kodera / dekodera. Bezobsługowy trening wstępny polega na tym, że najpierw trenuje każdą warstwę, kodując sygnał, dekodując sygnał, a następnie mierząc błąd rekonstrukcji. Strojenie może być następnie wykorzystane w celu uzyskania lepszej wydajności (np. Jeśli używasz denoisingu stosowych autoencoderów, możesz użyć propagacji wstecznej).

Jednym dobrym punktem wyjścia dla teorii DL jest:

http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.73.795&rep=rep1&type=pdf

a także te:

http://portal.acm.org/citation.cfm?id=1756025

(przepraszam, musiałem usunąć ostatni link z powodu systemu filtrowania spamu)

Nie zamieściłem żadnych informacji na temat KMS, ale są one ściśle powiązane (choć osobiście nieco trudniejsze do zrozumienia na początku).


Dzięki @f (x), jestem zainteresowany klasyfikacją segmentów lub łat (2D lub 3D) pikseli, ale chciałem zachować oryginalne pytanie tak ogólne, jak to możliwe. Jeśli różne metody działają najlepiej na różnych typach zestawów danych, byłbym zainteresowany dyskusją dotyczącą tych różnic.
Amelio Vazquez-Reina

1
Zasadniczo pod względem przetwarzania obrazu metody DL będą działać jako ekstraktory funkcji, które można następnie połączyć z SVM w celu dokonania klasyfikacji. Metody te są ogólnie porównywalne z metodami inżynierii ręcznej, takimi jak SIFT, SURF i HOG. Metody DL zostały rozszerzone na wideo z bramkowanymi CRBM i ISA. Ręcznie opracowane metody obejmują HOG / HOF, HOG3d i eSURF (dobre porównanie znajduje się w Wang i wsp. 2009).
user5268,

1

Świetne pytanie! Zarówno przyspieszenie adaptacyjne, jak i głębokie uczenie się można zaklasyfikować jako probabilistyczne sieci uczenia się. Różnica polega na tym, że „głębokie uczenie się” dotyczy konkretnie jednej lub więcej „sieci neuronowych”, podczas gdy „wzmacnianie” jest „algorytmem meta-uczenia się”, który wymaga jednej lub więcej sieci uczenia się, zwanych słabymi uczniami, które mogą być „czymkolwiek” (tj. sieć neuronowa, drzewo decyzyjne itp.). Algorytm wspomagający pobiera jedną lub więcej słabych sieci uczących się, tworząc tak zwaną „silną uczącą się”, która może znacznie „podnieść” ogólne wyniki sieci uczących się (tj. Viola i Jones Face Detector, OpenCV).

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.