Jednym ze sposobów przypisania wagi do zmiennej jest zmiana jej skali. Sztuczka działa w przypadku algorytmów klastrowania, o których wspominasz, mianowicie. średnie k, średnie ważone sprzężenie i średnie sprzężenie.
Kaufman, Leonard i Peter J. Rousseeuw. „ Znajdowanie grup w danych: wprowadzenie do analizy skupień ”. (2005) - strona 11:
Wybór jednostek miary powoduje wzrost względnych wag zmiennych. Wyrażenie zmiennej w mniejszych jednostkach doprowadzi do większego zakresu dla tej zmiennej, co będzie miało duży wpływ na wynikową strukturę. Z drugiej strony, poprzez standaryzację jednej próby nadania wszystkim zmiennym jednakowej wagi, w nadziei na osiągnięcie obiektywności. Jako taki może być stosowany przez praktyka, który nie posiada wcześniejszej wiedzy. Jednak może się zdarzyć, że niektóre zmienne są z natury ważniejsze niż inne w konkretnym zastosowaniu, a następnie przyporządkowanie wag powinno opierać się na wiedzy przedmiotowej (patrz np. Abrahamowicz, 1985).
Z drugiej strony podjęto próby opracowania technik klastrowania, które są niezależne od skali zmiennych (Friedman i Rubin, 1967). Propozycja Hardy'ego i Rassona (1982) polega na poszukiwaniu partycji, która minimalizuje całkowitą objętość wypukłych kadłubów klastrów. Zasadniczo taka metoda jest niezmienna w odniesieniu do transformacji liniowych danych, ale niestety nie istnieje algorytm do jej realizacji (z wyjątkiem przybliżenia ograniczonego do dwóch wymiarów). Dlatego dylemat standaryzacji wydaje się obecnie nieunikniony, a programy opisane w tej książce pozostawiają wybór użytkownikowi
Abrahamowicz, M. (1985), Wykorzystanie nieliczbowej informacji „pnon” do pomiaru różnic, artykuł zaprezentowany na Czwartym Europejskim Spotkaniu Towarzystwa Psychometrycznego i Towarzystw Klasyfikacyjnych, 2–5 lipca, Cambridge (Wielka Brytania).
Friedman, HP i Rubin, J. (1967), O niektórych niezmiennych kryteriach grupowania danych. J. Amer. Statystyk. ASSOC6., 2, 1159-1178.
Hardy, A., i Rasson, JP (1982), Une nouvelle approche des problemes de klasyfikation automique, Statist. Analny. Donnies, 7, 41–56.