Moje pytania dotyczą Losowych Lasów. Koncepcja tego pięknego klasyfikatora jest dla mnie jasna, ale wciąż istnieje wiele praktycznych pytań dotyczących użytkowania. Niestety nie udało mi się znaleźć żadnego praktycznego przewodnika po RF (szukałem czegoś takiego jak „Praktyczny przewodnik po szkoleniach z ograniczonymi maszynami Boltzmana” autorstwa Geoffrey'a Hintona, ale dla Random Forests!
Jak dostroić RF w praktyce?
Czy to prawda, że większa liczba drzew jest zawsze lepsza? Czy istnieje uzasadniony limit (z wyjątkiem oczywiście wydajności) na zwiększenie liczby drzew i jak je oszacować dla danego zestawu danych?
A co z głębokością drzew? Jak wybrać rozsądny? Czy ma sens eksperymentowanie z drzewami różnej długości w jednym lesie i jakie są tego wytyczne?
Czy są jakieś inne parametry, na które warto zwrócić uwagę podczas szkolenia RF? Algos do budowy pojedynczych drzew może być?
Kiedy mówią, że RF są odporne na nadmierne dopasowanie, jak to jest prawda?
Będę wdzięczny za wszelkie odpowiedzi i / lub linki do przewodników lub artykułów, które mogłem przeoczyć podczas wyszukiwania.