Mam dane z kilkoma tysiącami funkcji i chcę dokonać rekurencyjnego wyboru funkcji (RFE), aby usunąć te nieinformacyjne. Robię to z karetką i RFE. Jednak zacząłem myśleć, jeśli chcę uzyskać najlepsze dopasowanie regresji (na przykład losowy las), kiedy powinienem przeprowadzić strojenie parametrów ( mtrydla RF)? Tak więc, jak rozumiem, Caret trenuje RF wielokrotnie w różnych podzbiorach funkcji ze stałym mottem. Przypuszczam, że optymalny mtrypowinien być znaleziony po zakończeniu wyboru funkcji, ale czy mtrywartość użyta przez daszek wpłynie na wybrany podzbiór funkcji? Oczywiście korzystanie z karetki przy niskim mtryjest znacznie szybsze.
Mam nadzieję, że ktoś mi to wyjaśni.