Powszechnym podejściem do szacowania parametrów rozkładu normalnego jest użycie średniej i odchylenia standardowego / wariancji próbki.
Jeśli jednak występują pewne wartości odstające, mediana i odchylenie mediany od mediany powinny być znacznie bardziej niezawodne, prawda?
Na niektórych zbiorów danych Próbowałem, rozkład normalny szacowany przez wydaje się produkować znacznie lepsze dopasowanie niż klasyczny stosując średnią i Odchylenie RMS.
Czy jest jakiś powód, aby nie używać mediany, jeśli zakładasz, że w zbiorze danych występują pewne wartości odstające? Czy znasz jakieś odniesienia do tego podejścia? Szybkie wyszukiwanie w Google nie przyniosło mi przydatnych wyników, które omawiają korzyści płynące z zastosowania median tutaj (ale oczywiście „mediana szacowania parametrów rozkładu normalnego” nie jest bardzo konkretnym zestawem wyszukiwanych haseł).
Mediana odchylenia, czy jest stronnicza? Czy powinienem pomnożyć to przez aby zmniejszyć stronniczość?
Czy znasz podobne niezawodne metody szacowania parametrów dla innych rozkładów, takich jak rozkład gamma lub wykładniczo zmodyfikowany rozkład Gaussa (który wymaga Skośności w szacowaniu parametrów, a wartości odstające naprawdę psują tę wartość)?