GMM wykorzystuje zachodzące na siebie wzgórza, które rozciągają się do nieskończoności (ale praktycznie liczą się tylko dla 3 sigma). Każdy punkt otrzymuje wszystkie wyniki prawdopodobieństwa wzgórz. Ponadto wzgórza mają „jajowaty kształt” [w porządku, są to symetryczne elipsy ] i przy użyciu pełnej macierzy kowariancji można je przechylać .
K-znaczy twardo przypisuje punkt do jednego skupienia, więc wyniki innych ośrodków skupień są ignorowane (domyślnie są zerowane / nie przejmuj się). Wzgórza to kuliste bańki mydlane. Tam, gdzie dotykają się dwa bańki mydlane, granica między nimi staje się płaską (hiper) płaszczyzną. Podobnie jak podczas dmuchania piany z wielu baniek mydlanych, bąbelki wewnątrz nie są płaskie, ale są pudełkowate, więc granice między wieloma (hiper) sferami faktycznie tworzą przegrodę Voronoi przestrzeni. W 2D wydaje się to niejasno przypominać sześciokątne ciasne upakowanie, pomyśl o ulu pszczół (chociaż oczywiście komórki Voronoi nie są gwarantowane jako sześciokąty). Wzgórze K oznacza, że jest okrągłe i nie przechyla się, więc ma mniejszą siłę reprezentacji; ale obliczenia są znacznie szybsze, szczególnie w wyższych wymiarach.
Ponieważ K-oznacza używa metryki odległości euklidesowej, zakłada, że wymiary są porównywalne i mają taką samą wagę. Więc jeśli wymiar X ma jednostki mil na godzinę, w zakresie od 0 do 80, a wymiar Y ma jednostki funtów, w zakresie od 0 do 400, a ty dopasowujesz koła w tej przestrzeni XY, to jeden wymiar (i jego rozpiętość) będzie silniejszy niż inny wymiar i przyćmie wyniki. Dlatego zwyczajowo znormalizuje się dane podczas przyjmowania K-średnich.
Zarówno GMM, jak i K-znaczy modelują dane, dopasowując najlepsze przybliżenia do podanych danych. GMM pasuje do jaja przechylonego, a K-oznacza pasuje do kuleczek rozłożonych. Ale podstawowe dane mogą mieć dowolny kształt, może to być spirala lub obraz Picassa, a każdy algorytm nadal działałby i strzelał jak najlepiej. To, czy wynikowy model wygląda jak rzeczywiste dane, zależy od leżącego u podstaw fizycznego procesu generującego dane. (Na przykład pomiary opóźnienia czasowego są jednostronne; czy Gaussa dobrze pasuje? Może.)
Rn
W ten sposób twój obraz binarny 8x8 będzie interpretowany jako 64-wymiarowy hipersześcian w pierwszej hiperkwadrantu. Algorytmy wykorzystują analogie geometryczne do znajdowania klastrów. Odległość, wraz ze średnimi K, pojawia się jako odległość euklidesowa w 64-wymiarowej przestrzeni. To jeden ze sposobów, aby to zrobić.