O ile mi wiadomo, „środek” klastra i centroid pojedynczego klastra to to samo, chociaż termin „centroid” może być nieco bardziej precyzyjny niż „średni” w przypadku danych wielowymiarowych.
Aby znaleźć środek ciężkości, oblicza się (arytmetyczną) średnią pozycji punktów osobno dla każdego wymiaru. Na przykład, jeśli masz punkty w:
- (-1, 10, 3),
- (0, 5, 2) i
- (1, 20, 10),
wtedy środek ciężkości byłby zlokalizowany w ((-1 + 0 + 1) / 3, (10 + 5 + 20) / 3, (3 + 2 + 10) / 3), co upraszcza (0, 11 2/3, 5). (Uwaga: Centroid nie musi być - i rzadko jest --- jednym z oryginalnych punktów danych)
Środek ciężkości jest czasem nazywany również środkiem masy lub centrum środka ciężkości, w oparciu o jego fizyczną interpretację (jest to środek masy obiektu zdefiniowany przez punkty). Podobnie jak środek, położenie środka ciężkości minimalizuje kwadratową odległość od innych punktów.
Pokrewną ideą jest medoid , czyli punkt danych, który jest „najmniej odmienny” od wszystkich innych punktów danych. W przeciwieństwie do środka ciężkości, medoid musi być jednym z pierwotnych punktów. Może Cię również zainteresować mediana geometryczna, która jest podobna do mediany, ale dla danych wielowymiarowych. Oba różnią się od środka ciężkości.
ABcentroid(A)centroid(B)aiAdist(ai,b1)dist(ai,b2)dist(ai,bn)