Dowiedziałem się o PCA kilka wykładów temu na zajęciach i kopiąc więcej o tej fascynującej koncepcji, poznałem rzadkie PCA.
Chciałem zapytać, jeśli się nie mylę, to jest to rzadkie PCA: w PCA, jeśli masz punktów danych ze zmiennymi , możesz zastosować każdy punkt danych w przestrzeni wymiarowej przed zastosowaniem PCA. Po zastosowaniu PCA możesz ponownie przedstawić go w tej samej przestrzeni wymiarowej, ale tym razem pierwszy główny komponent będzie zawierał najwięcej wariancji, drugi będzie zawierał kierunek drugiej wariancji i tak dalej. Możesz więc wyeliminować kilka ostatnich głównych składników, ponieważ nie spowodują one dużej utraty danych i możesz je skompresować. Dobrze?
Rzadkie PCA wybiera główne składniki, tak aby te składniki zawierały mniej niezerowych wartości w swoich współczynnikach wektorowych.
Jak ma to pomóc w lepszej interpretacji danych? Czy ktoś może podać przykład?