Mój kolega i ja staramy się obejść różnicę między regresją logistyczną a maszyną SVM. Najwyraźniej optymalizują różne funkcje celu. Czy SVM jest tak proste, jak stwierdzenie, że jest klasyfikatorem dyskryminującym, który po prostu optymalizuje utratę zawiasów? A może jest to bardziej skomplikowane? W jaki sposób wektory pomocnicze wchodzą w grę? Co ze zmiennymi luzu? Dlaczego nie możesz mieć głębokiej SVM tak, jak nie możesz mieć głębokiej sieci neuronowej z funkcjami aktywacji sigmoidalnej?