Niższy niż oczekiwano zasięg ważnego próbkowania z symulacją

Starałem się odpowiedzieć na pytanie Ocenić integralny z Znaczenie metody pobierania próbek na badania . Zasadniczo użytkownik musi obliczyć

\int_{0}^{π} f (x) d x = \int_{0}^{π} \frac{1}{\cos (x)^{2} + x^{2}} d x

$\int_{0}^{\pi}f(x)dx=\int_{0}^{\pi}\frac{1}{\cos(x)^2+x^2}dx$

wykorzystanie rozkładu wykładniczego jako rozkładu ważności

q (x) = λ \exp^{- λ x}

$q(x)=\lambda\ \exp^{-\lambda x}$

i znajdź wartość $\lambda$ co daje lepsze przybliżenie całki (jej self-study). Przekształcam problem jako ocenę wartości średniej $\mu$ z $f(x)$ nad $[0,\pi]$ : całka jest wtedy sprawiedliwa $\pi\mu$ .

Niech więc $p(x)$ być pdf z $X\sim\mathcal{U}(0,\pi)$ , i pozwól $Y\sim f(X)$ : celem jest teraz oszacowanie

μ = E [Y] = E [f (X)] = \int_{R} f (x) p (x) d x = \int_{0}^{π} \frac{1}{\cos (x)^{2} + x^{2}} \frac{1}{π} d x

$\mu=\mathbb{E}[Y]=\mathbb{E}[f(X)]=\int_{\mathbb{R}}f(x)p(x)dx=\int_{0}^{\pi}\frac{1}{\cos(x)^2+x^2}\frac{1}{\pi}dx$

przy użyciu próbkowania ważności. Przeprowadziłem symulację w języku R:

# clear the environment and set the seed for reproducibility
rm(list=ls())
gc()
graphics.off()
set.seed(1)

# function to be integrated
f <- function(x){
    1 / (cos(x)^2+x^2)
}

# importance sampling
importance.sampling <- function(lambda, f, B){
    x <- rexp(B, lambda) 
    f(x) / dexp(x, lambda)*dunif(x, 0, pi)
}

# mean value of f
mu.num <- integrate(f,0,pi)$value/pi

# initialize code
means  <- 0
sigmas <- 0
error  <- 0
CI.min <- 0
CI.max <- 0
CI.covers.parameter <- FALSE

# set a value for lambda: we will repeat importance sampling N times to verify
# coverage
N <- 100
lambda <- rep(20,N)

# set the sample size for importance sampling
B <- 10^4

# - estimate the mean value of f using importance sampling, N times
# - compute a confidence interval for the mean each time
# - CI.covers.parameter is set to TRUE if the estimated confidence 
#   interval contains the mean value computed by integrate, otherwise
# is set to FALSE
j <- 0
for(i in lambda){
    I <- importance.sampling(i, f, B)
    j <- j + 1
    mu <- mean(I)
    std <- sd(I)
    lower.CB <- mu - 1.96*std/sqrt(B)  
    upper.CB <- mu + 1.96*std/sqrt(B)  
    means[j] <- mu
    sigmas[j] <- std
    error[j] <- abs(mu-mu.num)
    CI.min[j] <- lower.CB
    CI.max[j] <- upper.CB
    CI.covers.parameter[j] <- lower.CB < mu.num & mu.num < upper.CB
}

# build a dataframe in case you want to have a look at the results for each run
df <- data.frame(lambda, means, sigmas, error, CI.min, CI.max, CI.covers.parameter)

# so, what's the coverage?
mean(CI.covers.parameter)
# [1] 0.19

Kod jest w zasadzie prostą implementacją ważności próbkowania, zgodnie z zastosowaną tutaj notacją . Próbkowanie według ważności jest następnie powtarzane $N$ razy, aby uzyskać wiele oszacowań $\mu$ , i za każdym razem sprawdza się, czy przedział 95% obejmuje rzeczywistą średnią, czy nie.

Jak widać, dla $\lambda=20$ faktyczny zasięg wynosi zaledwie 0,19. I rośnie $B$ do wartości takich jak $10^6$ nie pomaga (zasięg jest jeszcze mniejszy, 0,15). Dlaczego to się dzieje?

r simulation exponential importance-sampling

— DeltaIV
źródło

Użycie nieskończonej funkcji ważności wsparcia dla skończonej całki wsparcia nie jest optymalne, ponieważ część symulacji służy do symulacji zer, że tak powiem. Przynajmniej skróć wykładniczy o

π

$\pi$ , co jest łatwe do zrobienia i symulacji.

— Xi'an

@ Xi'an, oczywiście, zgadzam się, jeśli musiałbym ocenić tę całkę za pomocą próbkowania ważności, nie użyłbym tego rozkładu ważności, ale próbowałem odpowiedzieć na pierwotne pytanie, które wymagało użycia rozkładu wykładniczego. Mój problem polegał na tym, że nawet jeśli to podejście jest dalekie od optymalnego, zasięg powinien nadal się zwiększać (średnio) as

B \to \infty

$B\to\infty$ . I właśnie to pokazał Greenparker.

— DeltaIV

Ważność próbkowania jest dość wrażliwa na wybór rozkładu ważności. Ponieważ wybrałeś $\lambda = 20$ , próbki, które narysujesz, rexpbędą miały średnią $1/20$ z wariancją $1/400$ . To jest dystrybucja, którą otrzymujesz

Jednak całka, którą chcesz ocenić, zmienia się od 0 do $\pi =3.14$ . Więc chcesz użyć $\lambda$ co daje ci taki zasięg. używam $\lambda = 1$ .

Za pomocą $\lambda = 1$ Będę w stanie zbadać pełną przestrzeń całkowitą od 0 do $\pi$ i wydaje się, że tylko kilka losowań $\pi$ zostaną zmarnowane. Teraz ponownie uruchamiam kod i zmieniam tylko $\lambda = 1$ .

# clear the environment and set the seed for reproducibility
rm(list=ls())
gc()
graphics.off()
set.seed(1)

# function to be integrated
f <- function(x){
  1 / (cos(x)^2+x^2)
}

# importance sampling
importance.sampling <- function(lambda, f, B){
  x <- rexp(B, lambda) 
  f(x) / dexp(x, lambda)*dunif(x, 0, pi)
}

# mean value of f
mu.num <- integrate(f,0,pi)$value/pi

# initialize code
means  <- 0
sigmas <- 0
error  <- 0
CI.min <- 0
CI.max <- 0
CI.covers.parameter <- FALSE

# set a value for lambda: we will repeat importance sampling N times to verify
# coverage
N <- 100
lambda <- rep(1,N)

# set the sample size for importance sampling
B <- 10^4

# - estimate the mean value of f using importance sampling, N times
# - compute a confidence interval for the mean each time
# - CI.covers.parameter is set to TRUE if the estimated confidence 
#   interval contains the mean value computed by integrate, otherwise
# is set to FALSE
j <- 0
for(i in lambda){
  I <- importance.sampling(i, f, B)
  j <- j + 1
  mu <- mean(I)
  std <- sd(I)
  lower.CB <- mu - 1.96*std/sqrt(B)  
  upper.CB <- mu + 1.96*std/sqrt(B)  
  means[j] <- mu
  sigmas[j] <- std
  error[j] <- abs(mu-mu.num)
  CI.min[j] <- lower.CB
  CI.max[j] <- upper.CB
  CI.covers.parameter[j] <- lower.CB < mu.num & mu.num < upper.CB
}

# build a dataframe in case you want to have a look at the results for each run
df <- data.frame(lambda, means, sigmas, error, CI.min, CI.max, CI.covers.parameter)

# so, what's the coverage?
mean(CI.covers.parameter)
#[1] .95

Jeśli bawisz się z $\lambda$ , zobaczysz, że jeśli zrobisz to naprawdę małe (.00001) lub duże, prawdopodobieństwo pokrycia będzie złe.

EDYTOWAĆ-------

Jeśli chodzi o prawdopodobieństwo pokrycia, maleje ono po przejściu $B = 10^4$ do $B = 10^6$ , to tylko przypadkowe zdarzenie, na podstawie tego, którego używasz $N = 100$ replikacje. Przedział ufności dla prawdopodobieństwa pokrycia w $B = 10^4$ jest,

.19 \pm 1.96 * \sqrt{\frac{.19 * (1 - .19)}{100}} = .19 \pm .0769 = (.1131, .2669) .

$.19 \pm 1.96*\sqrt{\dfrac{.19*(1-.19)}{100}} = .19 \pm .0769 = (.1131, .2669)\,.$

Więc nie można tak naprawdę powiedzieć, że rośnie $B = 10^6$ znacznie obniża prawdopodobieństwo pokrycia.

W rzeczywistości w swoim kodzie dla tego samego materiału siewnego zmień $N = 100$ do $N = 1000$ , a następnie z $B = 10^4$ , prawdopodobieństwo pokrycia wynosi .123 i przy $B = 10^6$ prawdopodobieństwo pokrycia wynosi $.158$ .

Teraz przedział ufności w okolicach .123 wynosi

.123 \pm 1.96 \sqrt{\frac{.123 * (1 - .123)}{1000}} = .123 \pm .0203 = (.102, .143) .

$.123 \pm 1.96\sqrt{\dfrac{.123*(1 - .123)}{1000}} = .123 \pm .0203 = (.102, .143)\,.$

Tak więc teraz z $N = 1000$ replikacje, otrzymujesz, że prawdopodobieństwo pokrycia znacznie wzrasta.

— Greenparker
źródło

Tak, wiem, że zasięg zmienia się z

λ

$\lambda$ : w szczególności uzyskano najlepszy zasięg dla

0.1 < λ < 2

$0.1<\lambda<2$ . Rozumiem teraz, że ponieważ CI dla średniej próbki opiera się na CLT, jest to wynik asymptotyczny. Dlatego może się tak zmieniać

λ

$\lambda$ wpływa na liczbę próbek potrzebnych do podejścia do „asymptotycznego reżimu”, że tak powiem. Ale chodzi o to, dlaczego

λ = 20

$\lambda =20$ zasięg maleje od wielkości próby

10^{4}

$10^4$ do wielkości próbki

10^{6}

$10^6$ ? Z pewnością powinien wzrosnąć, jeśli słaby zasięg był spowodowany tylko wysokim

λ

$\lambda$ wartość?

— DeltaIV

@DeltaIV Dokonałem edycji, aby odpowiedzieć na to pytanie. Istotą jest

N = 100

$N = 100$ to za mało replikacji, by powiedzieć coś z całą pewnością.

— Greenparker,

ah genialne! Nie pomyślałem o utworzeniu przedziału ufności dla samej proporcji pokrycia , a nie tylko dla średniej. Podobnie jak nitpick, nie użyłbym przedziału ufności Walda dla przedziału ufności proporcji. Ponieważ jednak proporcja jest mniejsza od 0 i 1, a liczba powtórzeń wynosi (w drugim przypadku

N = 1000

$N=1000$ ) stosunkowo duże, prawdopodobnie użycie interwału Wilsona lub Jeffreysa nie zrobiłoby żadnej różnicy. Poczekam chwilę, aby zobaczyć, czy są inne odpowiedzi, ale powiedziałbym, że w pełni zasługujesz na +100 :)

— DeltaIV