Badam wykorzystanie statystycznego testowania istotności (SST) do walidacji wyników analizy skupień. Znalazłem kilka artykułów na ten temat, takich jak
- „ Statystyczne znaczenie grupowania dla danych o dużych wymiarach i małych próbkach ” Liu, Yufeng i in. (2008)
- „ O niektórych testach istotności w analizie skupień ”, Bock (1985)
Ale jestem zainteresowany znalezieniem literatury, która dowodzi, że SST NIE jest odpowiedni do sprawdzania poprawności wyników analizy skupień. Jedynym źródłem, które znalazłem, twierdząc, że to jest, jest strona internetowa producenta oprogramowania
W celu wyjaśnienia:
Jestem zainteresowany badaniem, czy w wyniku analizy skupień wykryto znaczącą strukturę skupień, dlatego chciałbym wiedzieć o artykułach potwierdzających lub odrzucających obawy „dotyczące możliwości post-hoc testowania wyników danych eksploracyjnych analiza stosowana do znajdowania klastrów ".
Właśnie znalazłem artykuł z 2003 r. „ Metody grupowania i klasyfikacji ” autorstwa Milligana i Hirtle'a , na przykład, że użycie ANOVA byłoby nieprawidłową analizą, ponieważ dane nie mają losowych przypisań do grup.