Czy ktoś może wyjaśnić różnicę między RandomForestClassifier a ExtraTreesClassifier w scikit Learn. Spędziłem sporo czasu czytając artykuł:
P. Geurts, D. Ernst. I L. Wehenkel, „Extremely randomized trees”, Machine Learning, 63 (1), 3-42, 2006
Wygląda na to, że są to różnice dla ET:
1) Podczas wybierania zmiennych w podziale, próbki są pobierane z całego zestawu uczącego zamiast próbki typu bootstrap z zestawu uczącego.
2) Podziały są wybierane całkowicie losowo z zakresu wartości w próbie przy każdym podziale.
Rezultatem tych dwóch rzeczy jest znacznie więcej „liści”.