Odpowiedzi:
Warto spojrzeć na książki MW Berry:
Składają się z serii prac aplikacyjnych i przeglądowych. Najnowsze wydaje się być dostępne w formacie PDF pod następującym adresem: http://bit.ly/deNeiy .
Oto kilka linków związanych z CA w zastosowaniu do eksploracji tekstu:
Możesz także spojrzeć na Latent Semantic Analysis , ale zobacz moją odpowiedź: Praca przez problem klastrowania .
Znajdowanie grup w danych. Wprowadzenie do analizy skupień autorstwa profesorów Leonarda Kaufmana i Petera J. Rousseeuw.
Czytam książkę i uważam ją za bardzo przydatną, ponieważ:
Naszym celem było napisanie stosowanej książki dla ogólnego użytkownika. Chcieliśmy udostępnić analizę skupień osobom, które niekoniecznie mają silne zaplecze matematyczne lub statystyczne.
Zapewnia treść teoretyczną, aby zrozumieć funkcje dostępne w R
pakiecie Cluster .
Rozdziały można czytać indywidualnie zgodnie z interesującą metodą klastrową.
wyjątkiem jest rozdział 3, który jest oparty na rozdziale 2
Rozdziały książki to:
Bibliografia:
Kaufman, L., i Rousseeuw, PJ (2005). Znajdowanie grup w danych. Wprowadzenie do analizy skupień (s. 342). John Wiley & Sons Inc.
Maechler, M. (2013). Analiza skupień Rozszerzona Rousseeuw i in. CRAN.
Ten rozdział wstępu do eksploracji danych jest dostępny online i zawiera ładny przegląd.
Nie specjalnie o eksploracji tekstu, ale podobało mi się „Analiza danych eksploracyjnych z MATLAB” autorstwa Martineza i Martineza.
Kolejna szczegółowa książka, na którą warto spojrzeć: Handbook of Cluster Analysis autorstwa Henniga i in. (2015)