Analiza klas utajonych jest w rzeczywistości modelem mieszanki skończonej (patrz tutaj ). Główną różnicą między FMM a innymi algorytmami klastrowania jest to, że FMM oferuje ci podejście oparte na modelach, które tworzy klastry przy użyciu modelu probabilistycznego, który opisuje dystrybucję danych. Zamiast więc znajdować klastry z dowolnie wybraną miarą odległości, używasz modelu, który opisuje rozkład twoich danych i na podstawie tego modelu oceniasz prawdopodobieństwo, że pewne przypadki należą do pewnych ukrytych klas. Można więc powiedzieć, że jest to podejście odgórne (zaczyna się od opisu dystrybucji danych), podczas gdy inne algorytmy klastrowania są raczej podejściem oddolnym (można znaleźć podobieństwa między przypadkami).
Ponieważ do wyboru modelu danych używasz modelu statystycznego, a ocena dobroci dopasowania jest możliwa - w przeciwieństwie do grupowania. Ponadto, jeśli przyjmiesz, że istnieje jakiś proces lub „ukryta struktura”, która leży u podstaw struktury twoich danych, FMM wydaje się być właściwym wyborem, ponieważ pozwalają modelować ukrytą strukturę za twoimi danymi (zamiast po prostu szukać podobieństw).
Inną różnicą jest to, że FMM są bardziej elastyczne niż klastrowanie. Algorytmy klastrowania po prostu wykonują klastrowanie, podczas gdy istnieją modele oparte na FMM i LCA, które
- umożliwiają przeprowadzenie potwierdzającej analizy między grupami,
- łączyć modele teorii odpowiedzi na przedmiot (i inne) z LCA,
- uwzględniać zmienne towarzyszące, aby przewidzieć utajone członkostwo danej klasy,
- i / lub nawet modele regresji wewnątrzgrupowej w regresji klasy ukrytej ,
- umożliwiają modelowanie zmian w czasie w strukturze danych itp.
Więcej przykładów patrz:
Hagenaars JA & McCutcheon, AL (2009). Zastosowana analiza klas ukrytych. Cambridge University Press.
oraz dokumentację pakietów flexmix i poLCA w języku R, w tym następujące dokumenty:
Linzer, DA i Lewis, JB (2011). poLCA: pakiet R do analizy polimorficznej zmiennej utajonej klasy utajonej. Journal of Statistics Software, 42 (10), 1-29.
Leisch, F. (2004). Flexmix: Ogólne ramy dla modeli skończonych mieszanin i regresji szkła utajonego w R. Journal of Statistics Software, 11 (8), 1-18.
Grün, B., i Leisch, F. (2008). FlexMix wersja 2: skończone mieszanki z towarzyszącymi zmiennymi oraz zmiennymi i stałymi parametrami . Journal of Statistics Software, 28 (4), 1-35.
inferences
w tym kontekście i dlaczego interesują was tylko różnice w wnioskowaniu?