Pobieranie próbek z wielowymiarowego rozkładu normalnego podlegającego kwadratowym ograniczeniom

9

Chciałbym efektywnie rysować próbki z zastrzeżeniem, że . $x \in \mathbb{R}^d$ $\mathcal{N}(\mu, \Sigma)$ $||x||_2 = 1$

— Sobi
źródło

12

Formalne rozwiązanie tego problemu wymaga najpierw właściwej definicji

„ $\mathcal{N}_d(μ,Σ)$ zastrzeżeniem, że $||x||^2=1$ ”

Naturalnym sposobem jest zdefiniowanie rozkładu zależności od . I zastosować to warunkowo do przypadku . Jeśli użyjemy współrzędnych biegunowych , Jakobianem transformacji jest Dlatego gęstość warunkowa rozkładu $X\sim\mathcal{N}_d(μ,Σ)$ $||X||=\varrho$ $\varrho=1$

\begin{aligned} x_{1} & = ϱ \cos (θ_{1}) & θ_{1} \in [0, π] \\ x_{2} & = ϱ \sin (θ_{1}) \cos (θ_{2}) & θ_{2} \in [0, π] \\ ⋮ \\ x_{d - 1} & = ϱ (\prod_{i = 1}^{d - 2} \sin (θ_{i})) \cos (θ_{d - 1}) & θ_{d - 1} \in [0, 2 π] \\ x_{d} & = ϱ \prod_{i = 1}^{d - 1} \sin (θ_{i}) \end{aligned}

$\eqalign{ x_1&=\varrho\cos(\theta_1)\qquad&\theta_1\in[0,\pi]\\ x_2&=\varrho\sin(\theta_1)\cos(\theta_2)\qquad&\theta_2\in[0,\pi]\\ &\vdots\\ x_{d-1}&=\varrho \left( \prod_{i=1}^{d-2}\sin(\theta_i) \right) \cos(\theta_{d-1})\qquad&\theta_{d-1}\in[0,2\pi]\\ x_{d}&=\varrho\prod_{i=1}^{d-1}\sin(\theta_i) }$

ϱ^{d - 1} \prod_{i = 1}^{d - 2} \sin (θ_{i})^{d - 1 - i}

$\varrho^{d-1}\prod_{i=1}^{d-2}\sin(\theta_i)^{d-1-i}$

θ = (θ_{1}, \dots, θ_{d - 1})

$\mathbf{\theta}=(\theta_1,\ldots,\theta_{d-1})$ Biorąc pod uwagę to

ϱ

$\varrho$

f (θ | ϱ) \propto \exp \frac{- 1}{2} {(x (θ, ϱ) - μ)^{T} Σ^{- 1} (x (θ, ϱ) - μ)} \prod_{i = 1}^{d - 2} \sin (θ_{i})^{d - 1 - i}

$f(\mathbf{\theta}|\varrho) \propto \exp\frac{-1}{2}\left\{(x(\theta,\varrho)-\mu)^T\Sigma^{-1}(x(\theta,\varrho)-\mu) \right\} \prod_{i=1}^{d-2}\sin(\theta_i)^{d-1-i}$

Wniosek: Gęstość ta różni się od zwykłego zastosowania gęstości normalnej do punktu na sferze jednostkowej ze względu na jakobian.

Drugim krokiem jest rozważenie docelowej gęstości i zaprojektuj algorytm Monte Carlo łańcucha Markowa do badania przestrzeni parametrów . Moja pierwsza próba dotyczyłaby próbnika Gibbsa, zainicjowanego w punkcie na kuli najbliższej , czyli, i postępując pod jednym kątem na raz w sposób Metropolis w obrębie Gibbsa:

f (θ | ϱ = 1) \propto \exp \frac{- 1}{2} {(x (θ, 1) - μ)^{T} Σ^{- 1} (x (θ, 1) - μ)} \prod_{i = 1}^{d - 2} \sin (θ_{i})^{d - 1 - i}

$f(\mathbf{\theta}|\varrho=1) \propto \exp\frac{-1}{2}\left\{(x(\theta,1)-\mu)^T\Sigma^{-1}(x(\theta,1)-\mu) \right\} \prod_{i=1}^{d-2}\sin(\theta_i)^{d-1-i}$

[0, π]^{d - 2} \times [0, 2 π]

$[0,\pi]^{d-2}\times[0,2\pi]$

μ

$\mu$

μ / | | μ | |

$\mu/||\mu||$

Generuj (gdzie obliczane są sumy modulo ) i przyjmij tę nową wartość z prawdopodobieństwem else $\theta_1^{(t+1)}\sim\mathcal{U}([\theta_1^{(t)}-\delta_1,\theta_1^{(t)}+\delta_1])$ $\pi$ $\frac{f (θ_{1}^{(t + 1)}, θ_{2}^{(t)}, . . . | ϱ = 1)}{f (θ_{1}^{(t)}, θ_{2}^{(t)}, . . . | ϱ = 1)} \land 1$ $\dfrac{f(\theta_1^{(t+1)},\theta_2^{(t)},...|\varrho=1)}{f(\theta_1^{(t)},\theta_2^{(t)},...|\varrho=1)}\wedge 1$ $\theta_1^{(t+1)}=\theta_1^{(t)}$
Generuj (gdzie obliczane są sumy modulo ) i zaakceptuj tę nową wartość z prawdopodobieństwem else $\theta_2^{(t+1)}\sim\mathcal{U}([\theta_2^{(t)}-\delta_2,\theta_2^{(t)}+\delta_2])$ $\pi$ $\frac{f (θ_{1}^{(t + 1)}, θ_{2}^{(t + 1)}, θ_{3}^{(t)}, . . . | ϱ = 1)}{f (θ_{1}^{(t + 1)}, θ_{2}^{(t)}, θ_{3}^{(t)}, . . . | ϱ = 1)} \land 1$ $\dfrac{f(\theta_1^{(t+1)},\theta_2^{(t+1)},\theta_3^{(t)},...|\varrho=1)}{f(\theta_1^{(t+1)},\theta_2^{(t)},\theta_3^{(t)},...|\varrho=1)}\wedge 1$ $\theta_2^{(t+1)}=\theta_2^{(t)}$
$\ldots$
Wygeneruj (gdzie sumy są obliczane modulo ) i przyjmuj tę nową wartość z prawdopodobieństwem else $\theta_{d-1}^{(t+1)}\sim\mathcal{U}([\theta_{d-1}^{(t)}-\delta_{d-1},\theta_{d-1}^{(t)}+\delta_{d-1}])$ $2\pi$ $\frac{f (θ_{1}^{(t + 1)}, θ_{2}^{(t + 1)}, . . ., θ_{d - 1}^{(t + 1)} | ϱ = 1)}{f (θ_{1}^{(t + 1)}, θ_{2}^{(t + 1)}, . . ., θ_{d - 1}^{(t)} | ϱ = 1)} \land 1$ $\dfrac{f(\theta_1^{(t+1)},\theta_2^{(t+1)},...,\theta_{d-1}^{(t+1)}|\varrho=1)}{f(\theta_1^{(t+1)},\theta_2^{(t+1)},...,\theta_{d-1}^{(t)}| \varrho=1)}\wedge 1$ $\theta_{d-1}^{(t+1)}=\theta_{d-1}^{(t)}$

Skale , , , mogą być skalowane względem współczynników akceptacji kroków, w celu osiągnięcia idealnego celu . $\delta_1$ $\delta_2$ $\ldots$ $\delta_{d-1}$ $50\%$

Oto kod R ilustrujący powyższe, z wartościami domyślnymi dla i : $\mu$ $\Sigma$

library(mvtnorm)
d=4
target=function(the,mu=1:d,sigma=diag(1/(1:d))){
 carte=cos(the[1])
 for (i in 2:(d-1))
  carte=c(carte,prod(sin(the[1:(i-1)]))*cos(the[i]))
 carte=c(carte,prod(sin(the[1:(d-1)])))
 prod(sin(the)^((d-2):0))*dmvnorm(carte,mean=mu,sigma=sigma)}
#Gibbs
T=1e4
#starting point
mu=(1:d)
mup=mu/sqrt(sum(mu^2))
mut=acos(mup[1])
for (i in 2:(d-1))
  mut=c(mut,acos(mup[i]/prod(sin(mut))))
thes=matrix(mut,nrow=T,ncol=d-1,byrow=TRUE)
delta=rep(pi/2,d-1)     #scale
past=target(thes[1,])   #current target
for (t in 2:T){
 thes[t,]=thes[t-1,]
 for (j in 1:(d-1)){
   prop=thes[t,]
   prop[j]=prop[j]+runif(1,-delta[j],delta[j])
   prop[j]=prop[j]%%(2*pi-(j<d-1)*pi)
   prof=target(prop)
   if (runif(1)<prof/past){
     past=prof;thes[t,]=prop}
   }
}

— Xi'an
źródło

-3

$||x||_2^2=1$ nie jest ściśle możliwe, ponieważ jest (ciągłą) zmienną losową. Jeśli chcesz mieć wariancję 1, tj. (gdzie tylda oznacza, że szacujemy wariancję), wtedy musisz wymagać, aby jej wariancja wynosiła . Jednak to żądanie może być sprzeczne z . To znaczy, aby pobrać próbki z tą wariancją, potrzebujesz przekątnej aby była równa . $x$ $E[(x-\mu)^2]\tilde{=} \frac{1}{n}\sum (x-\mu)^2=\frac{1}{n} ||x-n||_2^2=\frac{1}{n}$ $\frac{1}{n}$ $\Sigma$ $\Sigma$ $\frac{1}{n}$

Aby ogólnie próbkować z tego rozkładu, możesz wygenerować iid standardowe normalne, a następnie pomnożyć przez , pierwiastek kwadratowy z , a następnie dodać średnie . $\Sigma^{0.5}$ $\Sigma$ $\mu$

— yoki
źródło

Dzięki za twoją odpowiedź. Jednym ze sposobów, w jaki mogę o tym myśleć, jest produkowanie tego, czego chcę (ale nie jest to wydajne), próbkowania odrzucenia . Tak więc nie jest to niemożliwe. Ale szukam skutecznego sposobu na zrobienie tego.

— Sobi