Czy istnieje strategia wyboru liczby drzew w GBM? W szczególności, ntrees
argument R
„s gbm
funkcji.
Nie rozumiem, dlaczego nie powinieneś ustawić ntrees
najwyższej rozsądnej wartości. Zauważyłem, że większa liczba drzew wyraźnie zmniejsza zmienność wyników z wielu GBM. Nie sądzę, aby duża liczba drzew prowadziła do nadmiernego dopasowania.
jakieś pomysły?