Losowy las jest zbiorem drzew decyzyjnych tworzonych przez losowo wybierając tylko niektóre funkcje, aby zbudować każde drzewo z (a czasem pakowania danych treningowych). Najwyraźniej dobrze się uczą i generalizują. Czy ktoś zrobił MCMC próbkowanie przestrzeni drzewa decyzyjnego lub porównał je z losowymi lasami? Wiem, że uruchomienie MCMC i zapisanie wszystkich próbkowanych drzew może być droższe obliczeniowo, ale interesują mnie teoretyczne cechy tego modelu, a nie koszty obliczeniowe. Mam na myśli coś takiego:
- Skonstruuj losowe drzewo decyzyjne (prawdopodobnie działałoby okropnie)
- Oblicz prawdopodobieństwo drzewa za pomocą czegoś takiego jak , lub może dodaj termin .P p r i o r ( T r e e )
- Wybierz losowy krok, aby zmienić drzewo i wybierz na podstawie prawdopodobieństwa .
- Co N kroków, zapisz kopię bieżącego drzewa
- Wróć do 3 dla niektórych dużych N * M razy
- Skorzystaj z kolekcji M zapisanych drzew, aby dokonać prognoz
Czy to dałoby wyniki podobne do losowych lasów? Pamiętaj, że tutaj nie wyrzucamy dobrych danych ani funkcji na żadnym etapie, w przeciwieństwie do losowych lasów.