Rozbieżność KL między dwoma jednowymiarowymi gaussami

Muszę ustalić rozbieżność KL między dwoma Gaussami. Porównuję moje wyniki z tymi , ale nie mogę odtworzyć ich wyników. Mój wynik jest oczywiście błędny, ponieważ KL nie jest równe 0 dla KL (p, p).

Zastanawiam się, gdzie popełniam błąd i pytam, czy ktokolwiek może to zauważyć.

Niech $p(x) = N(\mu_1, \sigma_1)$ i $q(x) = N(\mu_2, \sigma_2)$ . Z PRML Bishopa wiem o tym

K L (p, q) = - \int p (x) \log q (x) d x + \int p (x) \log p (x) d x

$KL(p, q) = - \int p(x) \log q(x) dx + \int p(x) \log p(x) dx$

gdzie integracja odbywa się na całej linii rzeczywistej i to

\int p (x) \log p (x) d x = - \frac{1}{2} (1 + \log 2 π σ_{1}^{2}),

$\int p(x) \log p(x) dx = -\frac{1}{2} (1 + \log 2 \pi \sigma_1^2),$

więc ograniczam się do $\int p(x) \log q(x) dx$ , który mogę zapisać jako

- \int p (x) \log \frac{1}{(2 π σ_{2}^{2})^{(1 / 2)}} e^{- \frac{(x - μ_{2})^{2}}{2 σ_{2}^{2}}} d x,

$-\int p(x) \log \frac{1}{(2 \pi \sigma_2^2)^{(1/2)}} e^{-\frac{(x-\mu_2)^2}{2 \sigma_2^2}} dx,$

na które można podzielić

\frac{1}{2} \log (2 π σ_{2}^{2}) - \int p (x) \log e^{- \frac{(x - μ_{2})^{2}}{2 σ_{2}^{2}}} d x .

$\frac{1}{2} \log (2 \pi \sigma_2^2) - \int p(x) \log e^{-\frac{(x-\mu_2)^2}{2 \sigma_2^2}} dx.$

Biorę dziennik, który dostaję

\frac{1}{2} \log (2 π σ_{2}^{2}) - \int p (x) (- \frac{(x - μ_{2})^{2}}{2 σ_{2}^{2}}) d x,

$\frac{1}{2} \log (2 \pi \sigma_2^2) - \int p(x) \bigg(-\frac{(x-\mu_2)^2}{2 \sigma_2^2} \bigg) dx,$

gdzie oddzielam sumy i otrzymuję $\sigma_2^2$ z całki.

\frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{\int p (x) x^{2} d x - \int p (x) 2 x μ_{2} d x + \int p (x) μ_{2}^{2} d x}{2 σ_{2}^{2}}

$\frac{1}{2} \log (2 \pi \sigma^2_2) + \frac{\int p(x) x^2 dx - \int p(x) 2x\mu_2 dx + \int p(x) \mu_2^2 dx}{2 \sigma_2^2}$

POZWALAĆ $\langle \rangle$ oznacza operator wartości oczekiwanej mocy $p$ , można przepisać to jako

\frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{⟨ x^{2} ⟩ - 2 ⟨ x ⟩ μ_{2} + μ_{2}^{2}}{2 σ_{2}^{2}} .

$\frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\langle x^2 \rangle - 2 \langle x \rangle \mu_2 + \mu_2^2}{2 \sigma_2^2}.$

Wiemy, że $var(x) = \langle x^2 \rangle - \langle x \rangle ^2$ . A zatem

⟨ x^{2} ⟩ = σ_{1}^{2} + μ_{1}^{2}

$\langle x^2 \rangle = \sigma_1^2 + \mu_1^2$

i dlatego

\frac{1}{2} \log (2 π σ^{2}) + \frac{σ_{1}^{2} + μ_{1}^{2} - 2 μ_{1} μ_{2} + μ_{2}^{2}}{2 σ_{2}^{2}},

$\frac{1}{2} \log (2 \pi \sigma^2) + \frac{\sigma_1^2 + \mu_1^2 - 2 \mu_1 \mu_2 + \mu_2^2}{2 \sigma_2^2},$

co mogę umieścić jako

\frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} .

$\frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2}.$

Łącząc wszystko, dochodzę do

\begin{aligned} K L (p, q) & = - \int p (x) \log q (x) d x + \int p (x) \log p (x) d x \\ = \frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} - \frac{1}{2} (1 + \log 2 π σ_{1}^{2}) \\ = \log \frac{σ_{2}}{σ_{1}} + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} . \end{aligned}

$\begin{align*} KL(p, q) &= - \int p(x) \log q(x) dx + \int p(x) \log p(x) dx\\\\ &= \frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2} (1 + \log 2 \pi \sigma_1^2)\\\\ &= \log \frac{\sigma_2}{\sigma_1} + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2}. \end{align*}$ Co jest złe, ponieważ wynosi

1

$1$ dla dwóch identycznych Gaussów.

Czy ktoś może zauważyć mój błąd?

Aktualizacja

Dzięki mpiktas za uporządkowanie sprawy. Poprawna odpowiedź to:

$KL(p, q) = \log \frac{\sigma_2}{\sigma_1} + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2}$

normal-distribution kullback-leibler

— bayerj
źródło

x - μ_{1}

$x-\mu_1$

co ze skrzynką z wieloma wariantami?

Właśnie widziałem w pracy badawczej, że kld powinien wynosić $ KL (p, q) = ½ * ((μ₁-μ₂) ² + σ₁² + σ₂²) * ((1 / σ₁²) + (1 / σ₂²)) - 2

— skyde

\int p (x) \log p (x) d x = \frac{1}{2} (1 + \log 2 π σ_{1}^{2})

$\int p(x) \log p(x) dx = \frac{1}{2} (1 + \log 2 \pi \sigma_1^2)$

\int p (x) \log p (x) d x = - \frac{1}{2} (1 + \log 2 π σ_{1}^{2})

$\int p(x) \log p(x) dx = -\frac{1}{2} (1 + \log 2 \pi \sigma_1^2)$

Odpowiedź znajduje się również w mojej pracy z 1996 r. Na temat strat wewnętrznych .

— Xi'an

Odpowiedzi:

OK, mój zły. Błąd znajduje się w ostatnim równaniu:

\begin{aligned} K L (p, q) & = - \int p (x) \log q (x) d x + \int p (x) \log p (x) d x \\ = \frac{1}{2} \log (2 π σ_{2}^{2}) + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} - \frac{1}{2} (1 + \log 2 π σ_{1}^{2}) \\ = \log \frac{σ_{2}}{σ_{1}} + \frac{σ_{1}^{2} + (μ_{1} - μ_{2})^{2}}{2 σ_{2}^{2}} - \frac{1}{2} \end{aligned}

$\begin{align} KL(p, q) &= - \int p(x) \log q(x) dx + \int p(x) \log p(x) dx\\\\ &=\frac{1}{2} \log (2 \pi \sigma_2^2) + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2} (1 + \log 2 \pi \sigma_1^2)\\\\ &= \log \frac{\sigma_2}{\sigma_1} + \frac{\sigma_1^2 + (\mu_1 - \mu_2)^2}{2 \sigma_2^2} - \frac{1}{2} \end{align}$

$-\frac{1}{2}$ $\mu_1=\mu_2$ $\sigma_1=\sigma_2$

— mpiktas
źródło

@mpiktas Naprawdę miałem na myśli pytanie - bayerj Jest dobrze opublikowanym badaczem i jestem studentem. Miło widzieć, że nawet sprytni faceci czasem wracają do pytania w Internecie :)

— N. McA.

μ_{1} σ_{1}

$\mu_1 \sigma_1$

μ_{2} σ_{2}

$\mu_2 \sigma_2$

N (u_{1}, σ_{1})

$N(u_1, \sigma_1)$

$p$ $\mu_1$ $\sigma^2_1$ $q$ $\mu_2$ $\sigma^2_2$ $q$ $p$

$\int \left[\log( p(x)) - log( q(x)) \right] p(x) dx$

$=\int \left[ -\frac{1}{2} \log(2\pi) - \log(\sigma_1) - \frac{1}{2} \left(\frac{x-\mu_1}{\sigma_1}\right)^2 + \frac{1}{2}\log(2\pi) + \log(\sigma_2) + \frac{1}{2} \left(\frac{x-\mu_2}{\sigma_2}\right)^2 \right]$ $\times \frac{1}{\sqrt{2\pi}\sigma_1} \exp\left[-\frac{1}{2}\left(\frac{x-\mu_1}{\sigma_1}\right)^2\right] dx$

$=\int \left\{\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2} \left[ \left(\frac{x-\mu_2}{\sigma_2}\right)^2 - \left(\frac{x-\mu_1}{\sigma_1}\right)^2 \right] \right\}$ $\times \frac{1}{\sqrt{2\pi}\sigma_1} \exp\left[-\frac{1}{2}\left(\frac{x-\mu_1}{\sigma_1}\right)^2\right] dx$

$=E_{1} \left\{\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2} \left[ \left(\frac{x-\mu_2}{\sigma_2}\right)^2 - \left(\frac{x-\mu_1}{\sigma_1}\right)^2 \right]\right\}$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2\sigma_2^2} E_1 \left\{(X-\mu_2)^2\right\} - \frac{1}{2\sigma_1^2} E_1 \left\{(X-\mu_1)^2\right\}$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2\sigma_2^2} E_1 \left\{(X-\mu_2)^2\right\} - \frac{1}{2}$

$(X - \mu_2)^2 = (X-\mu_1+\mu_1-\mu_2)^2 = (X-\mu_1)^2 + 2(X-\mu_1)(\mu_1-\mu_2) + (\mu_1-\mu_2)^2$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{1}{2\sigma_2^2} \left[E_1\left\{(X-\mu_1)^2\right\} + 2(\mu_1-\mu_2)E_1\left\{X-\mu_1\right\} + (\mu_1-\mu_2)^2\right] - \frac{1}{2}$

$=\log\left(\frac{\sigma_2}{\sigma_1}\right) + \frac{\sigma_1^2 + (\mu_1-\mu_2)^2}{2\sigma_2^2} - \frac{1}{2}$

— ocram
źródło