Kilka dobrych odpowiedzi wciąż pozostawia miejsce na więcej komentarzy.
Po pierwsze, nikt nie sprzeciwił się idei, że mediana jest przeznaczony do eliminacji wartości odstających, ale będę go zakwalifikować. Zamierzone znaczenie jest oczywiste, ale łatwo jest prawdziwe dane były bardziej skomplikowane. Co najwyżej mediana ma na celu pomijanie lub ignorowanie wartości odstających, ale nawet to nie jest gwarantowane. Na przykład przy ocenach 1 1 1 5 5 5 mediana i średnia zgadzają się na poziomie 3, więc wszystko może wydawać się dobre. Ale dodatkowe 5 spowoduje przechylenie mediany do 5, a dodatkowe 1 spowoduje przechylenie mediany do 1. Średnia zmieni się o około 0,286 w każdym przypadku. Stąd średnia jest tu bardziej odporne niż mediana. Przykład można odrzucić jako niezwykły, ale nie jest on oburzający. Punkt nie jest oryginalny, naturalny. Jedno miejsce jest wykonany jest w Mosteller, F. i Tukeya, JW 1977. Analiza danych i regresji. Reading, MA: Addison-Wesley, pp.34-35.
Po drugie, przycięte środki zostały wymienione i idea zasługuje na większy impuls. Średnia i mediana nie musi być tak, że stark alternatywy analityk musi wybrać (głosowanie) za jedną lub drugą stronę. Możesz rozważyć wszystkie możliwe przycięte środki w oparciu o przycięcie określonej liczby wartości w każdym ogonie . Tabela pokazuje jako # liczbę wartości uwzględnionych przy obliczaniu średniej:
+----------------------------+
| number # trimmed mean |
|----------------------------|
| 0 16 4.0625 |
| 1 14 4.214286 |
| 2 12 4.416667 |
| 3 10 4.6 |
| 4 8 4.75 |
| 5 6 4.833333 |
| 6 4 5 |
| 7 2 5 |
+----------------------------+
Główny obraz jest to, że można wybrać stopę dyskontową (ignoruj tak wiele wartości w każdej ogona jako podejrzanego) jako rodzaj ubezpieczenia od ryzyka jest wyłączony z powodu ekstremalnych wartości. Co widzę jest stosunkowo gładkiego gradientu pomiędzy średnią i medianę, przy czym oczekuje się tutaj, ponieważ możliwe wartości 1, 2, 3, 4, 5 są obecne w danych. Oczekiwany jest duży skok w sekwencji z izolowaną wartością odstającą.
Nie ma obowiązku z przyciętymi środków do wykończenia równych liczb w każdej ogonie, ale nie rozszerzy się na tym.
Po trzecie, przykładem są recenzje Amazon. Kontekst ma zawsze znaczenie przy określaniu sposobu podsumowania danych . W przypadku opinii Amazon najlepszą odpowiedzią jest, aby przeczytać! Jak wysokie i niskie stopnie podobnie może być na fałszywych podstawach (domyślnie: autor tej książki jest moim przyjacielem) i / lub nieistotne dla swojej decyzji (wyraźnie: re-sprzedawca traktował mnie źle), to nie jest dla mnie oczywista wpływ na sposób podsumowania takich danych, a nawet pokazanie dystrybucji Amazon jest maksymalnie informacyjny.
Po czwarte, a najbardziej elementarnym ale również fundamentalną wszystkich, który czyni wybrać? Czasami średnia i mediana powinny być zgłaszane zarówno (i, jak powiedział, wykres rozkładu zbyt).