Średnia minimalizuje błąd do kwadratu (lub normę L2, patrz tutaj lub tutaj ), więc naturalnym wyborem dla wariancji do pomiaru odległości od średniej jest użycie błędu do kwadratu (zobacz tutaj, dlaczego to zrobimy). Z drugiej strony, mediana minimalizuje błąd bezwzględny (norma L1), tj. Jest to wartość znajdująca się w „środku” twoich danych, więc absolutna odległość od mediany (tzw. Mediana Absolute Deviation lub MAD) wydaje się być lepsza miara stopnia zmienności wokół mediany. Możesz przeczytać więcej o tych relacjach w tym wątku .
Krótko mówiąc, wariancja różni się od MAD tym, w jaki sposób definiują one centralny punkt twoich danych, a to wpływa na sposób, w jaki mierzymy zmienność otaczających go punktów danych. Kwadratowe wartości sprawiają, że wartości odstające mają większy wpływ na punkt środkowy (średnia), podczas gdy w przypadku mediany wszystkie punkty mają taki sam wpływ na niego, więc odległość bezwzględna wydaje się bardziej odpowiednia.
Można to również wykazać za pomocą prostej symulacji. Jeśli porównasz wartości kwadratowych odległości od średniej i mediany, wtedy całkowita kwadratowa odległość jest prawie zawsze mniejsza od średniej niż od mediany. Z drugiej strony całkowita odległość bezwzględna jest mniejsza od mediany, a następnie od średniej. Kod R do przeprowadzenia symulacji znajduje się poniżej.
sqtest <- function(x) sum((x-mean(x))^2) < sum((x-median(x))^2)
abstest <- function(x) sum(abs(x-mean(x))) > sum(abs(x-median(x)))
mean(replicate(1000, sqtest(rnorm(1000))))
mean(replicate(1000, abstest(rnorm(1000))))
mean(replicate(1000, sqtest(rexp(1000))))
mean(replicate(1000, abstest(rexp(1000))))
mean(replicate(1000, sqtest(runif(1000))))
mean(replicate(1000, abstest(runif(1000))))
W przypadku zastosowania mediany zamiast średniej w oszacowaniu takiej „wariancji” doprowadziłoby to do wyższych oszacowań, niż w przypadku zastosowania średniej w tradycyjny sposób.
Nawiasem mówiąc, relacje między normami L1 i L2 można rozpatrywać również w kontekście bayesowskim, jak w tym wątku .