Odpowiedzi:
Jeśli zdefiniujesz jako posortowaną wersję oryginalnych danych X 1 , X 2 , … , X N , wówczas mediana zostanie zdefiniowana jako:
Bez porządkowania danych możesz użyć definicji mediany geometrycznej, aby zdefiniować medianę w jednym wymiarze:
Zauważ, że niekoniecznie oznacza to unikalną medianę, gdy liczba parzystych punktów jest równa; na przykład dowolna liczba optymalizuje cel z .
Jednym z alternatywnych sposobów wyrażenia średniej jest oszacowanie „najmniejszych kwadratów”:
Wybranie jako średniej daje najmniejszą wartość sumy kwadratów błędów.
Teraz medianę można wyrazić jako oszacowanie „najmniejszych odchyleń bezwzględnych”:
Wybranie jako mediany daje najmniejszą wartość sumy błędów bezwzględnych.
Mediana to wartość odpowiadająca połowie kwantyla, czyli połowa wartości jest wyższa, połowa jest mniejsza (wybacz mi za ignorowanie przypadków z równością lub gdy zbiór jest parzysty ...). Tak, że biorąc pod uwagę, że plik pdf zestawu danych jest znany, rozkład skumulowany można łatwo ocenić. Zwracając uwagę na tej funkcji, a następnie P X m e d i a n = P - 1 X ( 1
Weźmy na przykład przypadek dla kątów w tej metodzie użytej w tym artykule przeglądowym do wyrównywania histogramu. Lewy dolny panel pokazuje pdf kątów w zestawie naturalnych obrazów. to rozkład skumulowany, a mediana to wartość odpowiadająca wartości , czyli w tym przypadku około .P ( θ ) θ 1 / 2 0