Dlaczego warto korzystać z podstawowego średniego błędu kwadratu (RMSE) zamiast średniego bezwzględnego błędu (MAE)?
cześć
Badałem błąd wygenerowany w obliczeniach - początkowo obliczyłem błąd jako błąd pierwiastkowy znormalizowany do kwadratu.
Patrząc trochę bliżej, widzę, że efekt kwadratu błędu nadaje większą wagę większym błędom niż mniejszym, przekrzywiając oszacowanie błędu w kierunku nieparzystej wartości odstającej. Jest to dość oczywiste z perspektywy czasu.
Więc moje pytanie - w jakim przypadku błąd pierwiastkowy średni kwadrat byłby bardziej odpowiednią miarą błędu niż średni błąd bezwzględny? To ostatnie wydaje mi się bardziej odpowiednie, czy coś mi brakuje?
Aby to zilustrować, załączyłem poniższy przykład:
Wykres rozproszenia pokazuje dwie zmienne o dobrej korelacji,
dwa histogramy po prawej stronie przedstawiają błąd między Y (obserwowany) i Y (przewidywany) przy użyciu znormalizowanego RMSE (u góry) i MAE (u dołu).
Nie ma znaczących wartości odstających w tych danych, a MAE podaje mniejszy błąd niż RMSE. Czy jest jakaś racjonalność, inna niż MAE, która jest lepsza, aby zastosować jedną miarę błędu nad drugą?