Wiele plików PDF ma zakres od minus do dodatniej nieskończoności, ale niektóre środki są zdefiniowane, a niektóre nie. Jaka wspólna cecha sprawia, że niektóre są obliczalne?
Wiele plików PDF ma zakres od minus do dodatniej nieskończoności, ale niektóre środki są zdefiniowane, a niektóre nie. Jaka wspólna cecha sprawia, że niektóre są obliczalne?
Odpowiedzi:
Średnią rozkładu definiuje się w postaci całki (napiszę to tak, jak w przypadku dystrybucji ciągłej - powiedzmy jako całkę Riemanna - ale problem dotyczy bardziej ogólnie; możemy przejść do integracji Stieltjes lub Lebesgue, aby poradzić sobie z te poprawnie i wszystkie jednocześnie):
Ale co to znaczy? Jest to faktycznie skrót dla
lub
(chociaż możesz to zepsuć gdziekolwiek, nie tylko na 0)
Problem pojawia się, gdy granice tych całek nie są skończone.
Rozważmy na przykład standardową gęstość Cauchy'ego, która jest proporcjonalna do ... zwróć uwagę
niech , więc d u = 2 x
co nie jest skończone. Limit w dolnej połowie również nie jest skończony; oczekiwanie jest tym samym niezdefiniowane.
Lub gdybyśmy mieli jako zmienną losową wartość bezwzględną standardowego Cauchy'ego, jej całe oczekiwanie byłoby proporcjonalne do tego limitu, na który właśnie patrzyliśmy (tj. ).
Z drugiej strony, niektóre inne gęstości nadal przechodzą „do nieskończoności”, ale ich całka ma granicę.
Inne odpowiedzi są dobre, ale mogą nie przekonać wszystkich, zwłaszcza ludzi, którzy spojrzą na rozkład Cauchy'ego ( ) i powiedzą, że intuicyjnie oczywiste jest, że średnia powinna wynosić zero.
Przyczyna, dla której intuicyjna odpowiedź jest niepoprawna z matematycznego punktu widzenia, wynika z twierdzenia o rearanżacji Riemanna (wideo) .
W rzeczywistości to, co robisz, gdy patrzysz na Cauchy'ego i mówisz, że średnia „powinna wynosić zero”, polega na tym, że dzielisz „środek” na zero, a następnie żądasz momentu równowagi dwóch rozmiarów. Innymi słowy, domyślnie robisz nieskończoną sumę z „połową” wyrażeń dodatnich (chwile w każdym punkcie po prawej) i „połową” wyrażeń ujemnych (chwile w każdym punkcie po lewej) i żądasz tego sumuje się do zera. (Dla technicznie myślących: )
Twierdzenie o przegrupowaniu Riemanna mówi, że ten rodzaj nieskończonej sumy (jedna z dodatnimi i ujemnymi warunkami) jest spójna tylko wtedy, gdy obie dwie serie (tylko dodatnie i ujemne) są zbieżne, jeśli zostaną wzięte niezależnie. Jeśli obie strony (dodatnia i ujemna) są rozbieżne same w sobie, możesz wymyślić kolejność sumowania warunków, tak aby sumowała się do dowolnej liczby. (Film powyżej, od 6:50)
Tak więc, jeśli wykonasz sumowanie w sposób zrównoważony od zera, pierwsze chwile z rozkładu Cauchy'ego zostaną anulowane. Jednak (standardowa) definicja średniej nie wymusza takiej kolejności sumowania. Powinieneś być w stanie podsumować chwile w dowolnej kolejności i sprawić, by były one jednakowo ważne. Dlatego średnia rozkład Cauchy'ego jest niezdefiniowany - przez rozsądny wybór sposobu sumowania momentów, możesz sprawić, by były „zrównoważone” (lub nie) praktycznie w dowolnym momencie.
Tak więc, aby zdefiniować średnią rozkładu, każda z dwóch momentów musi być niezależnie zbieżna (skończona) wokół proponowanej średniej (która, gdy wykonujesz matematykę, jest tak naprawdę innym sposobem na powiedzenie, że pełna całka ( ) musi być zbieżny). Jeśli ogony są na tyle „grube”, że chwila jednej strony jest nieskończona, to koniec. Nie możesz zrównoważyć go nieskończonym momentem po drugiej stronie.
Powinienem wspomnieć, że „sprzeczne z intuicją” zachowanie takich rzeczy jak rozkład Cauchy'ego jest całkowicie spowodowane problemami w myśleniu o nieskończoności. Weź rozkład Cauchy'ego i odetnij ogony - nawet arbitralnie daleko, jak na plus / minus liczba xkcd - i (po ponownej normalizacji) nagle dostajesz coś, co jest dobrze wychowane i ma określoną wartość średnią. Problemem nie są same grube ogony, ale to, jak zachowują się te ogony, gdy zbliżasz się do nieskończoności.
General Abrial i Glen_b mieli doskonałe odpowiedzi. Chcę tylko dodać małe demo, aby pokazać, że średnia dystrybucja Cauchy'ego nie istnieje / nie jest zbieżna.
W kolejnym eksperymencie zobaczysz, że nawet otrzymasz dużą próbkę i obliczysz średnią empiryczną z próbki, liczby są zupełnie różne w zależności od eksperymentu.
set.seed(0)
par(mfrow=c(1,2))
experiments=rep(1e5,100)
mean_list_cauchy=sapply(experiments, function(n) mean(rcauchy(n)))
mean_list_normal=sapply(experiments, function(n) mean(rnorm(n)))
plot(mean_list_cauchy,ylim=c(-10,10))
plot(mean_list_normal,ylim=c(-10,10))
Można zaobserwować, że mamy eksperymentów, w każdym doświadczeniu, możemy spróbować 1 x 10 5 punktów z dwóch rozkładów, z tak dużym rozmiarze próbki, średnia empiryczna w różnych eksperymentach powinno być dość blisko do prawdziwej średniej. Wyniki pokazują, że rozkład Cauchy'ego nie ma średniej zbieżnej, ale rozkład normalny ma.
EDYTOWAĆ:
Jak wspomniano na czacie @ mark999, powinniśmy argumentować, że dwie dystrybucje użyte w eksperymencie mają podobną „wariancję” (powód, dla którego używam cytatu, ponieważ zmienność dystrybucji Cauchy'ego jest również nieokreślona). Oto uzasadnienie: ich pliki PDF są podobne.
curve(dnorm, -8,8)
curve(dcauchy, -8,8)
Z definicji całki Lebesgue-Stieltjes, średnia istnieje, jeżeli:
https://en.wikipedia.org/wiki/Moment_(mathematics)#S znaczącoance_of_the_moments
. This is different from the uniform distribution , though measures are indeed the same for arcs not containing . For example, on the arc from counter-clockwise to , the mean of the distribution on the circle is . But the mean of the uniform distribution on the corresponding union of two disjoint intervals, each of length , is zero.
Since the distribution on the circle is rotationally symmetric, there cannot be a mean, median or mode on the circle. Similarly, higher moments, such as variance, cannot make sense. This distribution arises naturally in many contexts. For example, my current project involves microscope images of cancerous tissue. The very numerous objects in the image are not symmetric and a "direction" can be assigned to each. The obvious null hypothesis is that these directions are uniformly distributed.
To disguise the simplicity, let be the standard unit circle, and let . We define as a function of by stereographical projection of the circle from onto the -axis. The formula is . Differentiating, we find . The infinitesimal probability is therefore , the usual form of the Cauchy distribution, and "Hey, presto!", simplicity becomes a headache, requiring treatment by the subtleties of integration theory.
In , we can ignore the absence of (in other words, reinstate ) for any consideration such as mean or higher order moment, because the probability of (its measure) is zero. So therefore the non-existence of mean and of higher moments carries over to the real line. However, there is now a special point, namely , which maps to under stereographic projection and this becomes the median and mode of the Cauchy distribution.