Rozważmy obserwacji ze standardowego rozkładu Cauchy'ego, który jest taki sam jak rozkład t Studenta z 1 stopniem swobody. Ogony tego rozkładu są na tyle ciężkie, że nie ma to żadnego znaczenia; rozkład jest wyśrodkowany na jego medianien=10000η=0.
Sekwencja próbki oznacza, że nie jest spójny dla środka rozkładu Cauchy'ego. Z grubsza mówiąc, trudność polega na tym, że występują bardzo ekstremalne obserwacje (dodatnie lub ujemne) z wystarczającą regularnością, że nie ma szans, że zbiegnie się do ( są nie tylko powolne, ale nie zawsze zbieżność. Rozkład jest znowu standardem Cauchy'ego [ dowód ].)Aj=1j∑ji=1XiXiAjη=0.AjAj
Dla kontrastu, na każdym etapie ciągłego procesu próbkowania, około połowa obserwacji będzie leżeć po obu stronach tak że sekwencja median próbki nie zbiegnie się zXiη,Hjη.
Ten brak zbieżności i zbieżności ilustruje następująca symulacja.AjHj
set.seed(2019) # for reproducibility
n = 10000; x = rt(n, 1); j = 1:n
a = cumsum(x)/j
h = numeric(n)
for (i in 1:n) {
h[i] = median(x[1:i]) }
par(mfrow=c(1,2))
plot(j,a, type="l", ylim=c(-5,5), lwd=2,
main="Trace of Sample Mean")
abline(h=0, col="green2")
k = j[abs(x)>1000]
abline(v=k, col="red", lty="dotted")
plot(j,h, type="l", ylim=c(-5,5), lwd=2,
main="Trace of Sample Median")
abline(h=0, col="green2")
par(mfrow=c(1,1))
Oto lista kroków, na których Możesz zobaczyć wpływ niektórych z tych ekstremalnych obserwacji na średnie bieżące na wykresie po lewej stronie (na pionowych czerwonych kropkowanych liniach).|Xi|>1000.
k = j[abs(x)>1000]
rbind(k, round(x[k]))
[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
k 291 898 1293 1602 2547 5472 6079 9158
-5440 2502 5421 -2231 1635 -2644 -10194 -3137
Ważna jest spójność w estymacji: Przy pobieraniu próbek z populacji Cauchy'ego średnia próbki z próby obserwacji nie jest lepsza do oszacowania centrum niż tylko jedna obserwacja. Natomiast spójna mediana próbki jest zbieżna z więc większe próbki dają lepsze oszacowania.n=10000ηη,