Doznacza odległość euklidesową między punktem wejściowym a punktem środkowym . Każdy punkt przypisuje się do najbliższego centrum gromady grupującego wierzchołki w różnych skupisk.c j k
Problem znany jest jako (dyskretny) problem klastrowania i jest to -hard. Można to pokazać z redukcją problemu kompletnego dominującego problemu, że jeśli istnieje algorytm aproksymacji dla problemu z to .NP NP ρ ρ < 2 P = NP
Optymalny algorytm aproksymacji jest bardzo prosty i intuicyjny. Najpierw wybiera arbitralnie punkt i umieszcza go w zbiorze centrów skupień. Następnie wybiera się kolejne centrum klastrów, które jest możliwie jak najdalej od wszystkich pozostałych centrów klastrów. Więc póki , my wielokrotnie znaleźć punkt , dla których odległość D (j, C) jest zmaksymalizowane i dodać go do C . Raz | C | = k skończone.p ∈ P C | C | < k j ∈ P D ( j , C ) C | C | = k
Nietrudno zauważyć, że optymalny algorytm zachłanny działa w czasie . Rodzi to pytanie: czy możemy osiągnąć czas ? O ile lepiej możemy zrobić?