Załóżmy, że mamy dwóch drzew regresji (drzewie i drzewa B) odwzorowanych wejściowe do wyjścia y ∈ R . Niech Y = F A ( x ) w drzewie i F B ( x ) na drzewa B. Każde drzewo wykorzystuje dzieli binarnej hiperplaszczyzn jako funkcji oddzielających.
Załóżmy teraz, że bierzemy sumę ważoną wyników drzewa:
Czy funkcja równoważna pojedynczemu (głębszemu) drzewu regresji? Jeśli odpowiedź brzmi „czasami”, to na jakich warunkach?
Idealnie chciałbym zezwolić na skośne hiperpłaszczyzny (tj. Podziały wykonywane na liniowych kombinacjach cech). Ale zakładając, że podziały jednej funkcji mogą być w porządku, jeśli jest to jedyna dostępna odpowiedź.
Przykład
Oto dwa drzewa regresji zdefiniowane w przestrzeni wejściowej 2d:
Rysunek pokazuje, w jaki sposób każde drzewo dzieli przestrzeń wejściową i dane wyjściowe dla każdego regionu (zakodowane w skali szarości). Kolorowe liczby wskazują obszary przestrzeni wejściowej: 3,4,5,6 odpowiadają węzłom liści. 1 to połączenie 3 i 4 itd.
Załóżmy teraz, że uśredniamy wydajność drzew A i B:
Średnia wydajność jest wykreślona po lewej stronie, z nałożonymi granicami decyzyjnymi drzew A i B. W takim przypadku możliwe jest skonstruowanie pojedynczego, głębszego drzewa, którego wynik jest równy średniej (wykreślony po prawej stronie). Każdy węzeł odpowiada regionowi przestrzeni wejściowej, który można zbudować z obszarów zdefiniowanych przez drzewa A i B (oznaczone kolorowymi liczbami na każdym węźle; wiele liczb oznacza przecięcie dwóch regionów). Pamiętaj, że to drzewo nie jest unikalne - moglibyśmy zacząć budować z drzewa B zamiast z drzewa A.
Ten przykład pokazuje, że istnieją przypadki, w których odpowiedź brzmi „tak”. Chciałbym wiedzieć, czy to zawsze prawda.