Jednym z największych problemów związanych z analizą skupień jest to, że może się zdarzyć, że będziemy musieli wyciągnąć odmienne wnioski, gdy oprą się na różnych zastosowanych metodach klastrowania (w tym różnych metodach łączenia w hierarchicznym klastrze).
Chciałbym poznać Twoją opinię na ten temat - którą metodę wybierzesz i jak. Można powiedzieć, że „najlepszą metodą grupowania jest odpowiednia odpowiedź”; ale w odpowiedzi mogę zapytać, czy analiza skupień ma być techniką bez nadzoru - skąd mam wiedzieć, która metoda lub połączenie jest właściwą odpowiedzią?
Ogólnie: czy sam klaster jest wystarczająco solidny, aby na nim polegać? Czy potrzebujemy drugiej metody i uzyskamy wspólny wynik, który będzie oparty na obu?
Moje pytanie dotyczy nie tylko możliwych sposobów sprawdzania / oceny wydajności klastrowania, ale jest szersze - na jakiej podstawie wybieramy / preferujemy jedną metodę / algorytm klastrowania nad inną. Czy są też powszechne ostrzeżenia , które powinniśmy rozejrzeć, wybierając metodę klastrowania naszych danych?
Wiem, że jest to bardzo ogólne pytanie i bardzo trudno na nie odpowiedzieć. Chciałbym tylko wiedzieć, czy masz jakieś uwagi, porady lub sugestie, aby dowiedzieć się więcej na ten temat.