Prawdopodobnie mam do czynienia z problemem, który prawdopodobnie został rozwiązany sto razy wcześniej, ale nie jestem pewien, gdzie znaleźć odpowiedź.
Przy użyciu regresji logistycznej, biorąc pod uwagę wiele cech i próbując przewidzieć binarną wartość kategorialną y , jestem zainteresowany wyborem podzbioru cech, który dobrze prognozuje y .
Czy można zastosować procedurę podobną do lasso? (Widziałem tylko lasso używane do regresji liniowej).
Czy spojrzenie na współczynniki dopasowanego modelu wskazuje na znaczenie różnych cech?
Edycja - wyjaśnienia po obejrzeniu niektórych odpowiedzi:
Kiedy mówię o wielkości dopasowanych współczynników, mam na myśli te, które są dopasowane do znormalizowanych cech (średnia 0 i wariancja 1). W przeciwnym razie, jak wskazał @probabilityislogic, 1000x wydaje się mniej ważne niż x.
Nie jestem zainteresowany po prostu znalezieniem najlepszego podzbioru k (jak oferował @Davide), ale raczej ważę znaczenie różnych funkcji względem siebie. Na przykład jedną cechą może być „wiek”, a drugą „wiek> 30”. Ich przyrostowe znaczenie może być niewielkie, ale oba mogą być ważne.