Czy estymator bezstronny minimalizuje średnie odchylenie bezwzględne?

Jest to kontynuacja, ale także inne pytanie w stosunku do mojego poprzedniego .

Czytałem na Wikipedii, że „ Estymator bezstronny minimalizuje ryzyko związane z funkcją utraty absolutnego odchylenia, jak zaobserwował Laplace ”. Jednak moje wyniki symulacji Monte Carlo nie potwierdzają tego argumentu.

próbkę z populacji logarytmicznej, , gdzie i są średnią logarytmiczną i log-sd, $X_1,X_2,...,X_N \sim \mbox{LN}(\mu,\sigma^2)$ $\mu$ $\sigma$ $\beta = \exp(\mu)=50$

Estymator średniej geometrycznej jest estymatorem bezstronnym dla mediany populacji , $\exp(\mu)$

$\hat{\beta}_{\mbox{GM}}= \exp(\hat{\mu})= \exp{(\sum\frac{\log(X_i)}{N})} \sim \mbox{LN}(\mu,\sigma^2/N)$ gdzie, i są średnią logarytmiczną, a log-sd, i to MLE dla i . $\mu$ $\sigma$ $\hat\mu$ $\hat\sigma$ $\mu$ $\sigma$

Podczas gdy skorygowany estymator średniej geometrycznej jest estymatorem bezstronnym dla mediany populacji.

$\hat{\beta}_{\mbox{CG}}= \exp(\hat{\mu}-\hat\sigma^2/2N)$

Generuję próbki wielkości 5 wielokrotnie z LN . Numer replikacji to 10 000. Średnie bezwzględne odchylenia, które otrzymałem, wynoszą 25,14 dla estymatora średniej geometrycznej i 22,92 dla skorygowanej średniej geometrycznej. Dlaczego? $(\log(50),\sqrt{\log(1+2^2)})$

BTW, oszacowana mediana bezwzględnych odchyleń wynosi 18,18 dla średniej geometrycznej i 18,58 dla skorygowanego estymatora średniej geometrycznej.

Użyłem skryptu R:

#```{r stackexchange}
#' Calculate the geomean to estimate the lognormal median.
#'
#' This function Calculate the geomean to estimate the lognormal
#' median.
#'
#' @param x a vector.
require(plyr)
GM <- function(x){
    exp(mean(log(x)))
}
#' Calculate the bias corrected geomean to estimate the lognormal
#' median.
#'
#' This function Calculate the bias corrected geomean using the
#' variance of the log of the samples, i.e., $\hat\sigma^2=1/(n-1)
# \Sigma_i(\Log(X_i)-\hat\mu)^2$
#'
#' @param x a vector.
BCGM <- function(x){
y <- log(x)
exp(mean(y)-var(y)/(2*length(y)))
}
#' Calculate the bias corrected geomean to estimate the lognormal
#' median.
#'
#' This function Calculate the bias corrected geomean using
#' $\hat\sigma^2=1/(n)\Sigma_i(\Log(X_i)-\hat\mu)^2$
#'
#' @param x a vector.
CG <- function(x){
y <- log(x)
exp(mean(y)-var(y)/(2*length(y))*(length(y)-1)/length(y))
}

############################

simln <- function(n,mu,sigma,CI=FALSE)
{
    X <- rlnorm(n,mu,sigma)
    Y <- 1/X
    gm <- GM(X)
    cg <- CG(X)
    ##gmk <- log(2)/GM(log(2)*Y) #the same as GM(X)
    ##cgk <- log(2)/CG(log(2)*Y)
    cgk <- 1/CG(Y)
    sm <- median(X)
    if(CI==TRUE) ci <- calCI(X)
    ##bcgm <- BCGM(X)
    ##return(c(gm,cg,bcgm))
    if(CI==FALSE) return(c(GM=gm,CG=cg,CGK=cgk,SM=sm)) else return(c(GM=gm,CG=cg,CGK=cgk,CI=ci[3],SM=sm))
}
cv <-2
mcN <-10000
res <- sapply(1:mcN,function(i){simln(n=5,mu=log(50),sigma=sqrt(log(1+cv^2)), CI=FALSE)})
sumres.mad <- apply(res,1,function(x) mean(abs(x-50)))
sumres.medad <- apply(res,1,function(x) median(abs(x-50)))
sumres.mse <- apply(res,1,function(x) mean((x-50)^2))
#```

#```{r eval=FALSE}
#> sumres.mad
      GM       CG      CGK       SM 
#25.14202 22.91564 29.65724 31.49275 
#> sumres.mse
      GM       CG      CGK       SM 
#1368.209 1031.478 2051.540 2407.218 
#```

— Zhenglei
źródło

1.) „10 000” jest za małe na twoje pytanie - spróbuj „250 000” (lub więcej). 2.) Jeśli uruchomisz symulację Monte Carlo i uzyskasz dziwny wynik, spróbuj zmienić ziarno za pomocą set.seed. 3) nie zawsze ufaj Wikipedia - notatka w jaki sposób cytowany tekst (z „Mediana” Artykuł) różni się od tej drugiej Wikipedia artykuł 4.) Twój R kod jest totalny bałagan - Check out Google R Style Przewodnik dla niektórych dobre wytyczne stylu.

— Steve S

$\alpha^+$ $\alpha$

$E=<|\alpha^+-\alpha|> = \int_{-\infty}^{\alpha^+} (\alpha^+-\alpha)f(\alpha) \mathrm{d}\alpha + \int^{\infty}_{\alpha^+} (\alpha-\alpha^+)f(\alpha)\mathrm{d}\alpha$

my wymagamy

$\frac{dE}{d\alpha^+} = \int_{-\infty}^{\alpha^+} f(\alpha) \mathrm{d}\alpha - \int^{\infty}_{\alpha^+} f(\alpha) \mathrm{d}\alpha = 0$

$P(\alpha > \alpha^+) = 1/2$ $\alpha^+$

Jeśli masz problemy z R, zadaj je w innym pytaniu na temat Przepełnienia stosu

— Keith
źródło

Teoretycznie myślę, że to prawda. Jestem jednak zdezorientowany wynikami symulacji R, która nie tworzy kopii zapasowej tego stwierdzenia zgodnie z oczekiwaniami.

— Zhenglei

Jestem Data Scientist / Physicist, więc nigdy nie widziałem linii R. Jak zasugerowałem w pytaniu, jeśli jest to problem z kodem, powinieneś zadać go w przepełnieniu stosu i zyskasz znacznie więcej uwagi. Jednak powyższa odpowiedź jest poprawna, chyba że chciałbyś wyjaśnić, w jaki sposób uogólnia ją na estymator bezstronny. Więcej informacji znajduje się na stronie 172 książki ET Jaynesa Teoria prawdopodobieństwa ISBN 978-0-521-59271-0.

— Keith,

Dziękuję bardzo za odpowiedź. To nie jest problem z kodowaniem. Chcę tylko przeprowadzić symulacje, aby pokazać, że estymator bezstronny zminimalizuje oczekiwane odchylenie bezwzględne. Nie zaakceptowałem odpowiedzi, ponieważ jestem głównie zdezorientowany co do etapu symulacji. Zaimplementowałem go w języku R, ale symulacje można wykonać w Matlabie, Pythonie lub innych językach.

— Zhenglei

\infty

$\infty$

@ Przykro mi z powodu mojej słabej matematyki, ale czy możesz pokazać więcej szczegółów na temat tego, jak uzyskałeś oczekiwania?

— AdamO,