Z samouczka XGBoost myślę, że gdy każde drzewo rośnie, wszystkie zmienne są skanowane w celu wybrania w celu podzielenia węzłów i zostanie wybrana ta z podziałem maksymalnego wzmocnienia. Więc moje pytanie brzmi: co jeśli dodam jakieś zmienne szumu do zbioru danych, czy te zmienne szumu wpłyną na wybór zmiennych (dla każdego drzewa rosnącego)? Moją logiką jest to, że ponieważ te zmienne szumowe wcale NIE dają maksymalnego podziału wzmocnienia, nigdy nie zostaną wybrane, więc nie wpływają na wzrost drzewa.
Jeśli odpowiedź brzmi „tak”, to czy to prawda, że „im więcej zmiennych, tym lepiej dla XGBoost”? Nie bierzmy pod uwagę czasu szkolenia.
Ponadto, jeśli odpowiedź brzmi „tak”, to czy prawdą jest, że „nie musimy filtrować nieistotnych zmiennych z modelu”.
Dziękuję Ci!