Powiadomienie po tabeli ANOVA po analizie K-średnich wskazuje, że poziomy istotności nie powinny być traktowane jako test równych średnich, ponieważ rozwiązanie klastrowe zostało wyprowadzone na podstawie odległości euklidesowej w celu maksymalizacji odległości. Jakiego testu należy użyć, aby pokazać, czy średnie zmiennych klastrowych różnią się między klastrami? Widziałem to ostrzeżenie w tabeli ANOVA podanej w wynikach k-średnich, ale w niektórych źródłach widzę, że przeprowadzane są testy ANOVA post-hoc. Czy powinienem zignorować dane wyjściowe ANOVA typu k-mean i uruchomić jednokierunkową analizę ANOVA z testami post-hoc i interpretować je w tradycyjny sposób? Czy mogę jedynie sugerować wielkość F i które zmienne przyczyniły się bardziej do różnicy? Innym nieporozumieniem jest to, że zmienne grupujące nie są zwykle dystrybuowane, co narusza założenie ANOVA, wtedy mógłbym zastosować test nieparametryczny Kruskala-Wallisa, ale ma on założenie o tych samych rozkładach. Rozkłady międzyklastrowe dla określonych zmiennych nie wydają się takie same, niektóre są dodatnio wypaczone, niektóre są negatywne ... Mam 1275 dużych próbek, 5 klastrów, 10 zmiennych klastrowych mierzonych w wynikach PCA.