Jestem trochę zmieszany z różnicą między SVM a perceptronem. Pozwólcie, że spróbuję podsumować moje rozumienie tutaj i proszę o poprawienie tam, gdzie się mylę i uzupełnienie tego, co przegapiłem.
Perceptron nie próbuje zoptymalizować „odległości” separacji. Tak długo, jak znajdzie hiperpłaszczyznę oddzielającą dwa zestawy, jest dobra. Z drugiej strony SVM próbuje zmaksymalizować „wektor wsparcia”, tj. Odległość między dwoma najbliższymi przeciwnymi punktami próbki.
SVM zazwyczaj próbuje użyć „funkcji jądra” do rzutowania punktów próbki na przestrzeń o dużych wymiarach, aby umożliwić ich liniowe rozdzielenie, podczas gdy perceptron zakłada, że punkty próbki są liniowo rozdzielalne.