Tak czy inaczej, każdy algorytm grupowania opiera się na pewnym pojęciu „bliskości” punktów. Intuicyjnie wydaje się, że można albo użyć względnego (niezmiennego w skali) pojęcia, albo bezwzględnego (spójnego) pojęcia bliskości, ale nie obu .
Najpierw spróbuję to zilustrować przykładem, a następnie powiem, jak ta intuicja pasuje do twierdzenia Kleinberga.
Ilustrujący przykład
Załóżmy, że mamy dwa zestawy i S 2 po 270 punktów każdy, ułożone w płaszczyźnie w następujący sposób:S1S2270
Na żadnym z tych zdjęć możesz nie zobaczyć punktów, ale to tylko dlatego, że wiele punktów jest bardzo blisko siebie. Po powiększeniu widzimy więcej punktów:270
Prawdopodobnie spontanicznie zgodzisz się, że w obu zestawach danych punkty są ułożone w trzy klastry. Okazuje się jednak, że jeśli powiększysz którykolwiek z trzech klastrów , zobaczysz:S2
Jeśli wierzysz w absolutne pojęcie bliskości lub w spójność, nadal będziesz to utrzymywał, niezależnie od tego, co właśnie zobaczyłeś pod mikroskopem, składa się tylko z trzech skupisk. Rzeczywiście jedyna różnica między S.S2 i S 2 jest to, że w obrębie każdej gromady niektóre punkty są teraz bliżej siebie. Jeśli natomiast wierzysz we względne pojęcie bliskości lub w niezmienność skali, będziesz skłonny argumentować, że S 2 nie składa się z 3, ale z 3 × 3 = 9 klastrów. Żaden z tych punktów widzenia nie jest zły, ale musisz dokonać wyboru w taki czy inny sposób.S1S2S233×3=9
Przypadek niezmienności izometrii
Jeśli porównasz powyższą intuicję z twierdzeniem Kleinberga, przekonasz się, że są one nieco sprzeczne. Rzeczywiście, twierdzenie Kleinberga wydaje się mówić, że możesz osiągnąć niezmienność skali i spójność jednocześnie, o ile nie zależy ci na trzeciej własności zwanej bogactwem. Jednak bogactwo nie jest jedyną własnością, którą tracisz, jeśli jednocześnie nalegasz na niezmienność skali i spójność. Tracisz także inną, bardziej fundamentalną właściwość: niezmienność izometryczną. To własność, której nie chciałbym poświęcić. Ponieważ nie pojawia się w pracy Kleinberga, zastanowię się nad tym przez chwilę.
Krótko mówiąc, algorytm grupowania jest niezmienny w przypadku izometrii, jeśli jego wynik zależy tylko od odległości między punktami, a nie od niektórych dodatkowych informacji, takich jak etykiety, które dołączasz do punktów lub od kolejności, którą narzucasz punktom. Mam nadzieję, że to brzmi jak bardzo łagodny i bardzo naturalny stan. Wszystkie algorytmy omówione w pracy Kleinberga są niezmienne izometrycznie, z wyjątkiem algorytmu pojedynczego wiązania z warunkiem zatrzymania klastra. Zgodnie z opisem Kleinberga, algorytm ten wykorzystuje porządek leksykograficzny punktów, więc jego wynik może rzeczywiście zależeć od sposobu ich oznaczenia. Na przykład dla zestawu trzech równo odległych punktów wynik algorytmu pojedynczego połączenia z 2k2- warunek zatrzymania klastra da różne odpowiedzi w zależności od tego, czy oznaczysz swoje trzy punkty jako „kot”, „pies”, „mysz” (c <d <m) lub jako „Tom”, „Spike”, „Jerry” (J <S <T):
To nienaturalne zachowanie można oczywiście łatwo naprawić, zastępując k -cluster zatrzymanie stan z „ -cluster stan zatrzymania”. Chodzi o to, aby po prostu nie zerwać więzi między równo odległymi punktami i przestać scalać klastry, gdy tylko osiągniemy co najmniej k klastrów. Ten naprawiony algorytm nadal będzie generował k(≤k) kk klastrów i będzie niezmienny izometrycznie i niezmiennie w skali. W zgodzie z powyższą intuicją nie będzie ona jednak spójna.
Aby precyzyjnie zdefiniować niezmienność izometrii, pamiętaj, że Kleinberg definiuje algorytm grupowania na skończonym zestawie jako mapę, która przypisuje każdą metrykę na SSS partycję :
Γ : { metryki na S } → { partycje S }S isometry i pomiędzy dwie metryki d i d ' w S jest permutacją i : S → S tak, że d ' ( I ( x ) , i ( Y ) ) = d ( x , y ) dla wszystkich punkty x i y w S .
Γ:{metrics on S}→{partitions of S}d↦Γ(d)
idd′Si:S→Sd′(i(x),i(y))=d(x,y)xyS
Definicja: Algorytm grupowania jest niezmiennikiem izometrii, jeśli spełnia następujący warunek: dla każdej metryki d i d ′ i każdej izometrii i między nimi punkty i ( x ) i i ( y ) leżą w tej samej grupie Γ ( d ′ )Γdd′ii(x)i(y)Γ(d′) , wtedy i tylko wtedy, gdy pierwotne punkty i y leżą w tym samym klastrze y ( d ) .xyΓ(d)
Myśląc o algorytmach grupowania, często identyfikujemy zestaw abstrakcyjny z konkretnym zestawem punktów na płaszczyźnie lub w innej przestrzeni otoczenia i wyobrażamy sobie różnicowanie metryki na S jako przesuwanie punktów S wokół. Rzeczywiście, jest to punkt widzenia, który przyjęliśmy w powyższym ilustracyjnym przykładzie. W tym kontekście niezmienność izometrii oznacza, że nasz algorytm grupowania jest niewrażliwy na rotacje, odbicia i tłumaczenia.SSS
Wariant twierdzenia Kleinberga
Podaną powyżej intuicję ujmuje następujący wariant twierdzenia Kleinberga.
Twierdzenie: Nie ma nietrywialnego algorytmu grupowania niezmiennego względem izometrii, który byłby jednocześnie spójny i niezmienny dla skali.
Tutaj przez trywialny algorytmu grupowania, mam na myśli jedną z dwóch następujących algorytmów:
algorytm, który przypisuje każdej metryki na dyskretnej partycji, w której każdy klaster składa się z jednego punktu,S
algorytm, który przypisuje każdą metrykę na partycji lump, składający się z jednego klastra.S
Twierdzenie jest takie, że te głupie algorytmy są jedynymi dwoma algorytmami niezmienniczymi w izometrii, które są zarówno spójne, jak i niezmienne w skali.
Dowód:
Niech będzie skończonym zbiorem, na którym ma działać nasz algorytm Γ . Niech d ₁ będzie metryką na S, w której dowolna para różnych punktów ma odległość jednostkową (tj. D ₁ ( x , y ) = 1 dla wszystkich x ≠ y w S ). Ponieważ Γ jest niezmienną izometrią, istnieją tylko dwie możliwości dla Γ ( d ₁ ) : albo Γ ( d ₁ ) jest dyskretną partycją, alboSΓd₁Sd₁(x,y)=1x≠ySΓΓ(d₁)Γ(d₁) to partycja ryczałtowa. Spójrzmy najpierw na przypadek, gdy Γ ( d ₁ ) jest partycją dyskretną. Biorąc pod uwagę dowolną metrykę d na S , możemy przeskalować ją tak, aby wszystkie pary punktów miały odległość ≥ 1 pod d . Następnie, zgodnie z konsekwencją, stwierdzamy, że Γ ( d ) = Γ ( d ₁ ) . Tak więc w tym przypadku Γ jest trywialnym algorytmem, który przypisuje dyskretną partycję do każdej metryki. Po drugie, rozważmy przypadek, w którym Γ (Γ(d₁)Γ(d₁)dS≥1dΓ(d)=Γ(d₁)Γ to partycja ryczałtowa. Możemy przeskalować dowolną metrykę d na S , aby wszystkie pary punktów miały odległość ≤ 1 , więc znowu spójność oznacza, że Γ ( d ) = Γ ( d ₁ ) . Więc Γ jest w tym przypadku również banalne. ∎Γ(d₁)dS≤1Γ(d)=Γ(d₁)Γ
Oczywiście, dowód ten jest bardzo bliski duchowi dowodu Margarety Ackerman na oryginalne twierdzenie Kleinberga, omówione w odpowiedzi Alexa Williamsa.