Znalazłem wiele artykułów, w których stwierdzono, że metody ulepszania są wrażliwe na wartości odstające, ale żaden artykuł nie wyjaśnia, dlaczego.
Z mojego doświadczenia wynika, że wartości odstające są złe dla dowolnego algorytmu uczenia maszynowego, ale dlaczego metody wspomagające są wyróżniane jako szczególnie wrażliwe?
Jak uszeregować następujące algorytmy pod względem wrażliwości na wartości odstające: drzewo doładowania, losowy las, sieć neuronowa, SVM i proste metody regresji, takie jak regresja logistyczna?