Myślę, że są to 2 różne rzeczy,
Zacznijmy od wyboru funkcji :
Technika ta służy do wybierania funkcji, które wyjaśniają najwięcej zmiennej docelowej (ma korelację ze zmienną docelową). Ten test jest przeprowadzany tuż przed zastosowaniem modelu do danych.
Aby to lepiej wyjaśnić, przejdźmy do przykładu: istnieje 10 cech i 1 zmienna docelowa, 9 cech wyjaśnia 90% zmiennej docelowej, a 10 cech razem wyjaśnia 91% zmiennej docelowej. Tak więc zmienna 1 nie robi dużej różnicy, więc starasz się ją usunąć przed modelowaniem (jest to również subiektywne dla biznesu). Mogę być również nazywany jako Znaczenie predyktora.
Teraz porozmawiajmy o wyodrębnianiu funkcji ,
Który jest wykorzystywany w uczeniu bez nadzoru, wydobywanie konturów na obrazach, wydobywanie bi-gramów z tekstu, wydobywanie fonemów z nagrywania mówionego tekstu. Jeśli nic nie wiesz o danych, np. Brak słownika danych, zbyt wiele funkcji, co oznacza, że dane nie są w zrozumiałym formacie. Następnie spróbuj zastosować tę technikę, aby uzyskać funkcje, które wyjaśniają większość danych. Wyodrębnianie cech obejmuje przekształcenie cech, które często nie jest odwracalne, ponieważ niektóre informacje są tracone w procesie zmniejszania wymiarów.
Możesz zastosować Wyodrębnianie cech dla danych danych, aby wyodrębnić cechy, a następnie zastosować Wybieranie cech w odniesieniu do zmiennej docelowej, aby wybrać podzbiór, który może pomóc w stworzeniu dobrego modelu z dobrymi wynikami.
możesz przejść przez te Link-1 , Link-2 dla lepszego zrozumienia.
możemy je zaimplementować w R, Python, SPSS.
daj mi znać, jeśli potrzebujesz dodatkowych wyjaśnień.