Czy ktoś może mi podpowiedzieć, kiedy wybrać SVM lub LR? Chcę zrozumieć intuicję stojącą za różnicą między kryteriami optymalizacji uczenia się hiperpłaszczyzny tych dwóch, gdzie odpowiednie cele są następujące:
- SVM: Spróbuj zmaksymalizować margines między najbliższymi wektorami wsparcia
- LR: Maksymalizuj prawdopodobieństwo tylnej klasy
Rozważmy liniową przestrzeń cech dla SVM i LR.
Niektóre różnice, o których już wiem:
- SVM jest deterministyczny (ale możemy użyć modelu Plattsa do oceny prawdopodobieństwa), podczas gdy LR jest probabilistyczny.
- W przypadku przestrzeni jądra SVM jest szybszy (sklepy obsługują tylko wektory)