Pytanie
Staram się zrozumieć, w jaki sposób prognoza jest utrzymywana w przedziale podczas klasyfikacji binarnej z funkcją wzmocnienia gradientu.
Załóżmy, że pracujemy nad problemem klasyfikacji binarnej, a naszą funkcją celu jest utrata logów, , gdzie jest zmienną docelową a jest naszym obecnym modelem.
Kiedy trenujesz kolejnego słabego ucznia tak aby nasz nowy model to H_i = H_ {i-1} + h_i , jaki jest mechanizm, który powinien utrzymywać H_i \ w [0,1] ? A może bardziej trafne pytanie, czy istnieje taki mechanizm?
Więcej informacji o tym, co robię
Próbuję wdrożyć wzmocnienie gradientu, używając drzew regresji. Aby tego uniknąć, należy pomnożyć przez współczynnik , tak że nie spada poniżej zera lub powyżej jeden i wybieram tym zakresie, który minimalizuje funkcję strat.
To pociąga za sobą następujący problem: po kilku rundach mam jeden punkt, który jest doskonale sklasyfikowany, a najlepszy dostępny podział, aby przesunąć klasyfikator w kierunku gradientu, chce przesunąć ten punkt ponad jeden, czego upewniam się, że nie nastąpi ustawienie . Zatem cała następna iteracja wybierze ten sam podział i to samo .
Próbowałem popularnych praktyk regularyzacji
- Zmniejszenie szybkości uczenia się przez pomnożenie przez . To tylko opóźnia problem.
- Podpróbkowanie przestrzeni cech, ale niektóre punkty są bardzo łatwe do sklasyfikowania, zaznaczają prawie każde pole w polu „czy to jest pozytywne?” forma i prawie każdy „dobry podział” pokazuje takie zachowanie.
Myślę, że to nie jest problem z parametrami i powinien być bardziej rozsądny sposób, aby to naprawić. Nie odrzucam możliwości zepsucia mojej implementacji, ale nie znalazłem nic, co mogłoby rozwiązać ten problem.
To, czym manipulujemy, w kontekście utraty logistyki, powinno być prawdopodobieństwem, więc jak tego uniknąć?
Moją intuicją byłoby umieszczenie modelu, który budujemy, , w funkcji sigmoidalnej, tak że jest on ograniczony do , i myślę, że to by działało, ale chcę wiedzieć, czy istnieją inne rozwiązania. Ponieważ wydaje się, że zwiększanie gradientu jest z powodzeniem stosowane w zadaniach klasyfikacji, powinno istnieć „prawidłowe” (tj. Z uzasadnieniem) rozwiązanie.