Analiza skupień, a następnie Analiza dyskryminacyjna

Jakie jest uzasadnienie, jeśli w ogóle, zastosowania analizy dyskryminacyjnej (DA) w odniesieniu do wyników algorytmu grupowania, takiego jak k-średnie, co widzę od czasu do czasu w literaturze (zasadniczo na temat klinicznego podtypu zaburzeń psychicznych)?

Zasadniczo nie zaleca się testowania różnic grupowych w zmiennych, które zostały użyte podczas budowy klastra, ponieważ obsługują one maksymalizację (lub minimalizację) bezwładności między klasami (lub wewnątrz klasy). Nie jestem więc pewien, czy w pełni docenię wartość dodaną predykcyjnego DA, chyba że staramy się osadzić jednostki w przestrzeni czynnikowej niższego wymiaru i uzyskać pojęcie o „uogólnianiu” takiej partycji. Ale nawet w tym przypadku analiza skupień pozostaje zasadniczo narzędziem eksploracyjnym, więc użycie członkostwa w klasie obliczonego w ten sposób w celu dalszego uzyskania reguły punktacji wydaje się dziwne na pierwszy rzut oka.

Jakieś rekomendacje, pomysły lub wskazówki do odpowiednich dokumentów?

clustering discriminant-analysis

— chl
źródło

Oto wyjaśnienie i przykład z użyciem R: cran.r-project.org/web/packages/adegenet/vignettes/...

— Ben

Nie znam żadnych dokumentów na ten temat. Zastosowałem to podejście do celów opisowych. DFA stanowi dobry sposób na podsumowanie różnic w grupach i wymiarów względem oryginalnych zmiennych. Łatwiej można po prostu profilować grupy na oryginalnych zmiennych, jednak traci to z natury wielowymiarowy charakter problemu klastrowania. DFA pozwala opisać grupy, zachowując nienaruszony wielowymiarowy charakter problemu. Może więc pomóc w interpretacji klastrów, gdzie jest to celem. Jest to szczególnie idealne, gdy istnieje ścisły związek między metodą grupowania a metodą klasyfikacji - np. DFA i metoda Warda.

Masz rację co do problemu testowania. Opublikowałem artykuł wykorzystujący analizę skupień z kontynuacją DFA, aby opisać rozwiązanie klastrowania. Przedstawiłem wyniki DFA bez statystyk testowych. Recenzent miał z tym problem. Uznałem i umieściłem tam statystyki testowe i wartości p, z zastrzeżeniem, że tych wartości p nie należy interpretować w tradycyjny sposób.

— Brett
źródło

Jakie byłyby kroki proceduralne DA po klastrowaniu? Czy możesz pomyśleć o innych technikach, aby dowiedzieć się, jakie oryginalne zmienne różnią określone klastry od innych?

— danas.zuokas

Chcesz podzielić się cytatem z tego artykułu, Brett?

— Roman Luštrik

Weissman & Magill. 2008. „Opracowanie typologii studenckiej w celu zbadania skuteczności seminariów pierwszego roku” Journal of The First Year Experience & Student in Transition 20 (2). Skontaktuj się ze mną offline, jeśli chcesz wydrukować.

— Brett,