Powiedzmy, że mam predykcyjny model klasyfikacji oparty na losowym lesie (używając pakietu randomForest w R). Chciałbym to skonfigurować, aby użytkownicy końcowi mogli określić element, dla którego ma zostać wygenerowana prognoza, i wyświetli prawdopodobieństwo klasyfikacji. Jak dotąd nie ma problemu.
Byłoby jednak użyteczne / fajne, aby móc wygenerować coś w rodzaju wykresu o zmiennej ważności, ale dla konkretnego przewidywanego elementu, a nie dla zestawu treningowego. Coś jak:
Przewiduje się, że pozycja X będzie psem (prawdopodobnie 73%),
ponieważ:
nogi = 4
oddech = złe
futro = krótkie
jedzenie = paskudne
Dostajesz punkt. Czy istnieje standardowy lub przynajmniej uzasadniony sposób wydobywania tych informacji z wyszkolonego losowego lasu? Jeśli tak, to czy ktoś ma kod, który zrobi to dla pakietu randomForest?
m
predyktorów jeden po drugim i sprawdzanie, jak las inaczej przewiduje, wydaje się trochę drogie. Musi być lepszy sposób.