Czytam ten artykuł na temat różnicy między zasadową analizą składową a analizą wielokrotnych dyskryminacji (liniowa analiza dyskryminacyjna) i próbuję zrozumieć, dlaczego kiedykolwiek używałbyś PCA zamiast MDA / LDA.
Wyjaśnienie podsumowano w następujący sposób:
z grubsza mówiąc w PCA staramy się znaleźć osie o maksymalnych wariancjach, w których dane są najbardziej rozproszone (w obrębie klasy, ponieważ PCA traktuje cały zestaw danych jako jedną klasę), aw MDA dodatkowo maksymalizujemy rozproszenie między klasami.
Czy nie zawsze chciałbyś zarówno zmaksymalizować wariancję, jak i zmaksymalizować rozrzut między klasami?