Mam dane z kilkoma tysiącami funkcji i chcę dokonać rekurencyjnego wyboru funkcji (RFE), aby usunąć te nieinformacyjne. Robię to z karetką i RFE. Jednak zacząłem myśleć, jeśli chcę uzyskać najlepsze dopasowanie regresji (na przykład losowy las), kiedy powinienem przeprowadzić strojenie parametrów ( mtry
dla RF)? Tak więc, jak rozumiem, Caret trenuje RF wielokrotnie w różnych podzbiorach funkcji ze stałym mottem. Przypuszczam, że optymalny mtry
powinien być znaleziony po zakończeniu wyboru funkcji, ale czy mtry
wartość użyta przez daszek wpłynie na wybrany podzbiór funkcji? Oczywiście korzystanie z karetki przy niskim mtry
jest znacznie szybsze.
Mam nadzieję, że ktoś mi to wyjaśni.