Kiedy mielibyśmy używać pędów i środkowego zamiast kwantyli i środkowej?


14

Nie mogę znaleźć definicji tantile ani medial na Wikipedii lub Wolfram Mathworld, ale następujące wyjaśnienie podano w Bílková, D. i Mala, I. (2012), „ Zastosowanie metody momentu L podczas modelowania rozkładu dochodów w Czechach ”, Austrian Journal of Statistics , 41 (2), 125–132.

Przyśrodkowa jest wartością gantile 50% (próbki), podobnie jak mediana próbki jest równa wartości kwantyla 50% próbki. Próbki pędów, a także kwantyle próbek są oparte na próbce uporządkowanej. Przede wszystkim oceniane są skumulowane sumy obserwacji w uporządkowanej próbie. Następnie, dla danej procentowej p , 0<p<100 , A p% tantile określa się jako wartość zmiennej analizowanej że dzieli wszystkie obserwacje w uporządkowanym próbki na dwie części: suma mniejsza lub równa obserwacji jest p%całkowitej sumy obserwacji i sumy obserwacji, które są większe, stanowi resztkowy (100p)% tej sumy.

Kiedy warto zastosować je jako miary lokalizacji, a nie bardziej konwencjonalną medianę lub inne kwantyle? Jedną możliwą sytuację, dochody gospodarstw domowych, podano w tym dokumencie:

Z tej definicji można wywnioskować, że medial może być stosowany jako rozsądna cecha poziomu dochodu, ponieważ gospodarstwa domowe o dochodzie niższym lub równym medialnemu otrzymują połowę całkowitego dochodu w próbie, te o wyższym dochodzie niż przyśrodkowe przyjmowanie drugiej połowy.

W tym przypadku stwierdzono, że średni dochód gospodarstwa domowego wynosi 117 497 CZK (tj. Połowa gospodarstw domowych zarobiła więcej niż to, a połowa zarobiła powyżej), w porównaniu do medialnego dochodu gospodarstwa domowego w wysokości 133 930 CZK (gospodarstwa domowe o dochodzie powyżej tej liczby otrzymują połowę całkowity przychód). Zauważ, że to porównanie niekoniecznie odzwierciedla skośność dochodów gospodarstw domowych, a nawet jego nierównomierność: nawet jeśli dochody gospodarstw domowych byłyby równomiernie rozłożone, mediala nadal leżałaby powyżej mediany. O ile rozumiem definicję, medial byłby równy medianie tylko wtedy, gdyby wszystkie gospodarstwa domowe otrzymywały taki sam dochód.

Czy jest więc jakiś konkretny powód, aby preferować medial w tym przypadku, a przynajmniej użyć go jako środka dodatkowego? Co dokładnie mówi nam porównanie między medianą a medialną? Z powodów, które właśnie zauważyłem, nie wydaje się, że medial jest bezpośrednio porównywalny z innymi miarami tendencji centralnej. Czy istnieją inne sytuacje, w których medialne / gantile są szeroko stosowane lub postrzegane jako szczególnie pouczające? Praktyczne przykłady ich zastosowania, wraz z przykładowymi pracami badawczymi, byłyby bardzo mile widziane, a intuicyjna koncepcja szerszego kontekstu, w którym mogłyby okazać się przydatne, byłaby jeszcze lepsza.

Musi wymagać, aby sumy i sumy częściowe były znaczące - coś, co wydaje się istotne z pieniędzmi i jak „placek” jest dystrybuowany - ale nawet czynność dodawania ma znaczenie tylko dla niektórych ilości. W przypadku intensywnych, a nie rozległych właściwości , takich jak gęstość lub temperatura, jakiekolwiek podsumowanie nie miałoby fizycznego znaczenia. Wydaje mi się, że rozległa własność jest konieczna, ale niewystarczająca, aby gantile były pomocne, ponieważ mogę sobie wyobrazić analityka żeglugowego zainteresowanego, jaką masą przewożonego ładunku jest granica, tak aby 50% całego ładunku (wagowo) było przewożone w ładunkach o tej lub większej masie, ale nie wyobrażam sobie ekologa, który byłby zainteresowany tym, jaka długość traszki jest taka, że ​​50% całkowitej długości wszystkich traszek pochodzi od traszek tej długości lub większej.


3
@NickCox O ile rozumiem, mediana podaje wartość odcięcia, gdzie z grubsza (całkowicie ignoruję kwestię powiązań), połowa gospodarstw domowych otrzymuje więcej niż granica, a połowa gospodarstw domowych otrzymuje mniej niż to. Medial daje inną wartość graniczną, tak że całkowity dochód gospodarstw domowych otrzymujących więcej niż wartość graniczna stanowi 50% wszystkich dochodów, podczas gdy całkowity dochód gospodarstw domowych otrzymujących mniej niż wartość graniczna stanowi 50% wszystkich dochodów.
Silverfish

2
Wskazówka: ciekawi mnie to po komentarzu @ttnphns na moje poprzednie pytanie ; środki (arytmetyczne, geometryczne, harmoniczne, zasilane, wykładnicze, kombinatoryczne itp.) są „średnimi analitycznymi”. Mediana, kwantyle, pile są „średnimi pozycyjnymi”.
Silverfish

4
Dzięki; Źle to przeczytałem i doceniam korektę. Chciałbym przeformułować z „sumy obserwacji” na „sumę wartości”, ponieważ „suma obserwacji” jest dla mnie zbyt bliska „liczbie obserwacji”. A może szukam wymówki ... Powinien istnieć związek z krzywymi Lorenza. Miara wydaje się przydatna tylko wtedy, gdy dana zmienna jest teoretycznie addytywna lub ekstensywna. Sir David Cox często podkreśla znaczenie, czy zmienne są rozległe. Dlatego sensownie jest rozważyć całkowity dochód, całkowite opady, ale nie całkowity dochód z logów lub całkowitą temperaturę.
Nick Cox

2
@NickCox Uważam, że ekstensywność jest doskonałym punktem (moim zdaniem sugerowane przeredagowanie byłoby również ulepszeniem), choć wydaje mi się, że obszerna właściwość jest konieczna, ale niewystarczająca, aby pomocna była pomoc. Wydaje się prawdopodobne, że moglibyśmy być zainteresowani np. Jaką masą przewożonego ładunku jest granica, tak aby 50% całego ładunku (wagowo) przewożono w ładunkach o tej lub większej masie; ale nie wyobrażam sobie, aby interesować się, jaka długość traszki jest taka, że ​​50% całkowitej długości wszystkich traszek pochodzi od traszek o tej długości lub większej.
Silverfish

1
Zgadzam się w praktyce, ale nie sądzę, aby zasada ta została naruszona. Odpowiedź na „Ale to nie byłoby interesujące ani użyteczne” nie zawsze musi być przejawem zasady matematycznej lub statystycznej; istnieje również pole „Nie rób tego!”.
Nick Cox

Odpowiedzi:


3

p=0.5Xf(x)μ=EXμ=xf(x)dx

G(t)=txf(x)dx
tG(t)=μ/2

Czy ta interpretacja jest poprawna? Czy to było zamierzone?

Wracając do pierwotnego pytania, w kontekście podziału dochodu, tantile jest wartością dochodu taką, że połowa całkowitego dochodu przeznaczona jest dla osób o wyższym dochodzie, a połowa całkowitego dochodu przeznaczona jest dla osób o niższym dochodzie.

EDIT

G(t)

G(t)t

Innym terminem używanym w tym pomyśle jest „częściowe oczekiwanie”. Zobacz na przykład /math/1080530/the-partial-expectation-mathbbex-xk-for-an-alpha-stable-distribution-r i użyj google!

X>0

Fk(x)=1EXk0xtkf(t)dt
kG(t)=μF1(t)F1FF0
{(u,L(u))}={(u,v):u=F(x),v=F1(x);x0}


1
Dzięki za dodanie - będę musiał trochę poczytać po wyglądzie!
Silverfish
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.