Pytania:
- Jaka jest różnica między drzewkami regresji wzmocnionej (BRT) a uogólnionymi modelami wzmocnionej (GBM)? Czy można ich używać zamiennie? Czy jedna jest specyficzną formą drugiej?
- Dlaczego Ridgeway użył wyrażenia „Uogólnione modele regresji wzmocnionej” (GBM), aby opisać to, co Friedman wcześniej zaproponował jako „maszynę do zwiększania gradientu” (GBM)? Te dwa akronimy są identyczne, opisują to samo, ale pochodzą z różnych fraz.
Tło:
Mam problem z określeniem różnic między warunkami BRT i GBM. Z tego, co rozumiem, oba są terminami opisującymi drzewa klasyfikacji i regresji, które mają stochastyczność włączoną przez pewien rodzaj wzmocnienia (np. Tworzenie worków, ładowanie początkowe, walidacja krzyżowa). Ponadto z tego, co zbieram, pojęcie GBM zostało po raz pierwszy wymyślone przez Friedmana (2001) w jego pracy „Chciwe przybliżenie funkcji: maszyna zwiększająca gradient”. Następnie Ridgeway wdrożył procedurę opisaną przez Friedmana w 2006 r. W swoim pakiecie „Uogólnione modele regresji wzmocnionej” (GBM). W mojej dziedzinie (ekologia) Elith i in. (2008) był pierwszym, który zademonstrował gbm
pakiet Ridgeway do modelowania rozmieszczenia gatunków. Jednak autorzy w Elith i in. użyj terminu „wzmocnione drzewo regresji” (BRT), aby opisać Friedmana i Ridgewaya ”
Jestem zdezorientowany, czy te terminy mogą być używane zamiennie? To nieco mylące, że jeden autor użyłby tego samego akronimu (z innej frazy) do opisania tej samej teorii, którą zaproponował poprzedni autor. Jest także mylące, że trzeci autor użył zupełnie innego terminu, opisując tę teorię w kategoriach ekologicznych.
Najlepsze, co mogę wymyślić, to to, że BRT są specyficzną formą GBM, w której dystrybucja jest dwumianowa, ale nie jestem tego pewien.
Elith i in. zdefiniuj drzewka regresji wzmocnionej w ten sposób… ”Wzmocnione drzewa regresji łączą zalety dwóch algorytmów: drzew regresji (modeli, które reagują na ich predyktory poprzez rekurencyjne podziały binarne) i wzmocnienia (adaptacyjna metoda łączenia wielu prostych modeli w celu uzyskania lepszej wydajności predykcyjnej Ostateczny model BRT można rozumieć jako model regresji addytywnej, w którym poszczególne terminy są prostymi drzewami, dopasowanymi do przodu, w sposób zwięzły ”(Elith i in. 2008).