Czy jest jakaś różnica między terminami „sieć neuronowa” i „perceptron”?
Czy jest jakaś różnica między terminami „sieć neuronowa” i „perceptron”?
Odpowiedzi:
Tak, istnieje - „perceptron” odnosi się do konkretnego nadzorowanego modelu uczenia się, który został nakreślony przez Rosenblatta w 1957 roku. Perceptron jest szczególnym rodzajem sieci neuronowej i jest w rzeczywistości historycznie ważny, ponieważ rozwinął się jeden z rodzajów sieci neuronowej. Istnieją inne typy sieci neuronowych, które zostały opracowane po perceptronie, a różnorodność sieci neuronowych stale rośnie (zwłaszcza biorąc pod uwagę, jak bardzo nowoczesne i modne jest głębokie uczenie się).
Modele perceptronów są zawarte w zestawie modeli sieci neuronowych.
Perceptron (jednowarstwowy) to jednowarstwowa sieć neuronowa, która działa jako liniowy binarny klasyfikator. Będąc jednowarstwową siecią neuronową można ją trenować bez użycia bardziej zaawansowanych algorytmów, takich jak propagacja wsteczna, a zamiast tego można ją szkolić, „krok w stronę” błędu w krokach określonych przez szybkość uczenia się. Kiedy ktoś mówi perceptron, zwykle myślę o wersji jednowarstwowej.
Jeśli jednak mówisz o perceptronie wielowarstwowym , termin ten jest taki sam, jak zwrotna sieć neuronowa .
Procedury uczenia się Perceptron nie można uogólniać na ukryte warstwy
• Procedura konwergencji perceptronów polega na tym, że za każdym razem, gdy zmieniają się wagi, zbliżają się do każdego „hojnie wykonalnego” zestawu wag.
- Tego rodzaju gwarancji nie można rozszerzyć na bardziej złożone sieci, w których średnia z dwóch dobrych rozwiązań może być złym rozwiązaniem.
• Zatem „wielowarstwowe” sieci neuronowe nie wykorzystują procedury uczenia się perceptronu.
- Nigdy nie powinny być nazywane perceptronami wielowarstwowymi.
-Reference Coursera.org - Kurs sieci neuronowej - Tydzień 3
Jak wspomniano @Nick Preceptron jest sieć neuronowa z pojedynczej warstwy, które wykorzystują programy ręcznie napisany w oparciu o zdrowy rozsądek, aby określić możliwości . Funkcje te są używane jako dane wejściowe do sieci, a następnie na tej podstawie podejmują binarne decyzje .
[Zdjęcie i wyjaśnienie oparte na Hinton Slide's in Coursera]