Jakie metody wykorzystują algorytmy uczenia drzewa decyzyjnego do radzenia sobie z brakującymi wartościami.
Czy po prostu wypełniają boks, używając wartości o nazwie brakującej?
Dzięki.
Jakie metody wykorzystują algorytmy uczenia drzewa decyzyjnego do radzenia sobie z brakującymi wartościami.
Czy po prostu wypełniają boks, używając wartości o nazwie brakującej?
Dzięki.
Odpowiedzi:
Istnieje kilka metod używanych przez różne drzewa decyzyjne. Po prostu ignorowanie brakujących wartości (jak robi to ID3 i inne stare algorytmy) lub traktowanie brakujących wartości jako innej kategorii (w przypadku cechy nominalnej) nie jest prawdziwą obsługą brakujących wartości. Jednak te podejścia zastosowano na wczesnych etapach rozwoju drzewa decyzyjnego.
Rzeczywiste podejście do obsługi brakujących danych nie wykorzystuje punktu danych z brakującymi wartościami do oceny podziału. Jednak po utworzeniu i przeszkoleniu węzłów potomnych instancje te są w jakiś sposób dystrybuowane.
Wiem o następujących metodach dystrybucji brakujących instancji wartości do węzłów potomnych: