TLDR:
Sieć neuronowa splotowa jest podklasą sieci neuronowych, które mają co najmniej jedną warstwę splotową. Doskonale nadają się do przechwytywania lokalnych informacji (np. Sąsiednie piksele na obrazie lub otaczające słowa w tekście), a także do zmniejszania złożoności modelu (szybsze szkolenie, wymaga mniejszej liczby próbek, zmniejsza ryzyko nadmiernego dopasowania).
Patrz poniższy wykres, który przedstawia kilka neuronowe sieciami architektur tym głęboko konwencjonalnych sieciach neuronowych-: .
Sieci neuronowe (NN) , a ściślej sztuczne sieci neuronowe (ANN) , to klasa algorytmów uczenia maszynowego, które ostatnio zyskały wiele uwagi (ponownie!) Ze względu na dostępność Big Data i urządzeń do szybkiego przetwarzania danych (większość Deep Learning algorytmy są zasadniczo różnymi odmianami ANN).
Klasa ANN obejmuje kilka architektur, w tym Convolutional Neural Networks ( CNN ), Recurrent Neural Networks ( RNN ) np. LSTM i GRU , Autoencoders i Deep Belief Networks . Dlatego CNN jest tylko jednym rodzajem ANN.
Ogólnie rzecz biorąc, ANN to zbiór połączonych i przestrajalnych jednostek (zwanych także węzłami, neuronami i sztucznymi neuronami), które mogą przekazywać sygnał (zwykle liczbę o wartościach rzeczywistych) z jednej jednostki do drugiej. Liczba (warstw) jednostek, ich typy i sposób, w jaki są ze sobą połączone, nazywany jest architekturą sieci.
W szczególności CNN ma jedną lub więcej warstw jednostek splotu . Jednostka splotu otrzymuje dane wejściowe z wielu jednostek z poprzedniej warstwy, które razem tworzą bliskość. Dlatego jednostki wejściowe (które tworzą małe sąsiedztwo) dzielą się swoimi wagami.
Jednostki splotu (jak również jednostki pulujące) są szczególnie korzystne, ponieważ:
- Zmniejszają liczbę jednostek w sieci (ponieważ są mapowaniami wiele do jednego ). Oznacza to, że jest mniej parametrów do nauczenia się, co zmniejsza ryzyko nadmiernego dopasowania, ponieważ model byłby mniej złożony niż w pełni połączona sieć.
- Rozważają kontekst / wspólne informacje w małych dzielnicach. Ta przyszłość jest bardzo ważna w wielu aplikacjach, takich jak przetwarzanie obrazu / wideo, przetwarzanie tekstów i mowy / wydobywanie, ponieważ sąsiednie wejścia (np. Piksele, ramki, słowa itp.) Zwykle niosą ze sobą powiązane informacje.
Przeczytaj poniższe informacje, aby uzyskać więcej informacji na temat (głębokich) CNN:
- Klasyfikacja ImageNet z głębokimi konwencjalnymi sieciami neuronowymi
- Pogłębiając się dzięki zwojom
ps ANN nie jest „systemem opartym luźno na ludzkim mózgu”, ale raczej klasą systemów inspirowanych połączeniami neuronów w mózgach zwierząt.