Badałem k-średnich i oto, co otrzymałem: k-średnich jest jednym z najprostszych algorytmów, który wykorzystuje metodę uczenia bez nadzoru w celu rozwiązania znanych problemów związanych z klastrowaniem. Działa naprawdę dobrze z dużymi zestawami danych.
Istnieją jednak także wady K-Means:
- Silna wrażliwość na wartości odstające i hałas
- Nie działa dobrze w przypadku nieokrągłego kształtu skupienia - liczba skupień i początkowa wartość początkowa muszą zostać wcześniej określone
- Niska zdolność do przekroczenia lokalnego optimum.
Czy jest coś wielkiego w k-średnich, ponieważ wydaje się, że wady wykraczają poza dobre strony k-średnich.
Proszę, naucz mnie.