Pozwolić być funkcją, którą nazywamy funkcją podobieństwa . Przykłady funkcji podobieństwa to odległość cosinus, norma, odległość Hamminga, podobieństwo Jaccard itp.
Rozważać binarne wektory długości : .
Naszym celem jest grupowanie wektorów, które są podobne. Bardziej formalnie chcemy obliczyć wykres podobieństwa, w którym węzły są wektorami, a krawędzie reprezentują wektory podobne ().
i są bardzo dużymi liczbami i porównują dwie długości wektory są drogie, nie możemy wykonać całej brutalnej siły operacje. Chcemy obliczyć wykres podobieństwa przy znacznie mniejszej liczbie operacji.
czy to możliwe? Jeśli nie, to możemy obliczyć przybliżenie do wykresu, który zawiera wszystkie krawędzie na wykresie podobieństwa plus co najwyżej inne krawędzie?