Rozumiem, że SVM jest bardzo podobny do regresji logistycznej (LR), tj. Ważona suma funkcji jest przekazywana do funkcji sigmoidalnej w celu uzyskania prawdopodobieństwa przynależności do klasy, ale zamiast utraty entropii krzyżowej (logistycznej) funkcja, trening odbywa się przy użyciu utraty zawiasu. Zaletą stosowania utraty zawiasu jest to, że można wykonywać różne sztuczki numeryczne, aby zwiększyć wydajność jądra. Wadą jest jednak to, że wynikowy model ma mniej informacji niż odpowiadający mu model LR. Na przykład bez jądra (przy użyciu jądra liniowego) granica decyzyjna SVM nadal znajdowałaby się w tym samym miejscu, w którym LR dałoby prawdopodobieństwo 0,5, ALE nie można powiedzieć, jak szybko prawdopodobieństwo przynależności do klasy zanika od granica decyzji.
Moje dwa pytania to:
- Czy powyższa interpretacja jest poprawna?
- W jaki sposób użycie utraty zawiasu powoduje, że interpretacja wyników SVM jako prawdopodobieństwa jest nieprawidłowa?