Załóżmy, że mamy zbiór elementów E i podobieństwo ( nie odległość funkcja) sim (ei, ej) między dwoma elementami El, EJ ∈ E .
Jak moglibyśmy (skutecznie) grupować elementy E za pomocą karty SIM ?
k- oznacza, na przykład, wymaga określonego k , klastrowanie baldachimu wymaga dwóch wartości progowych. Co jeśli nie chcemy takich predefiniowanych parametrów?
Zauważ, że sim nie jest koniecznie metryką (tzn. Nierówność trójkąta może, ale nie musi). Co więcej, nie ma znaczenia, czy klastry są rozłączne (partycje E ).
1-sim(ei, ej) = Distance
. Za pomocą metryki odległości możesz na przykład zastosować hierarchiczne grupowanie. Schodząc od korzenia zobaczysz, na jakim poziomie klastrów ziarnistości ma sens dla twojego konkretnego problemu.