Mam algorytm grupowania (nie k-średnich) z parametrem wejściowym (liczba klastrów). Po wykonaniu grupowanie Chciałbym zaczerpnąć ilościową miarą jakości tego grupowania. Algorytm klastrów ma jedną istotną właściwość. Dla , jeśli karmię punktów danych bez istotnej różnicy między nimi do tego algorytmu w wyniku otrzymam jeden klaster zawierający punktów danych i jeden klaster z punktu danych. Oczywiście nie jest to, co chcę. Chcę więc obliczyć ten miernik jakości, aby oszacować racjonalność tego grupowania. Idealnie będę mógł porównać to środki do innego . Uruchomię więc grupowanie w zakresiei wybrać jedną z najlepszych jakości. W jaki sposób obliczyć takiej miary jakości?
AKTUALIZACJA:
Oto przykład, gdy jest złym klastrów. Powiedzmy, że są 3 punkty na płaszczyźnie tworzącej trójkąt równoboczny. Rozdzielenie tych punktów na 2 klastrów jest oczywiście gorzej niż dzielenie ich na 1 lub 3 klastrów.