Zdaję sobie sprawę, że w modelu drzew przypominających są 3 parametry dostrajania, tj
- liczba drzew (liczba iteracji)
- parametr skurczu
- liczba podziałów (wielkość każdego drzewa składowego)
Moje pytanie brzmi: jak dla każdego parametru dostrajania znaleźć optymalną wartość? I jaką metodę?
Zauważ, że: parametr skurczu i parametr liczby drzew działają razem, tj. Mniejsza wartość parametru skurczu prowadzi do wyższej wartości dla liczby drzew. I musimy to również wziąć pod uwagę.
Szczególnie interesuje mnie metoda znalezienia optymalnej wartości dla liczby podziałów. Czy powinien opierać się na walidacji krzyżowej lub wiedzy o domenie dotyczącej modelu?
A jak te rzeczy są przeprowadzane w gbm
pakiecie w R?