Jakie jest prawdopodobieństwo, że

Załóżmy, że $X$ i $Y$ są dwuwymiarowe normalne ze średnią $\mu=(\mu_1,\mu_2)$ i kowariancją $\Sigma = \begin{bmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{12} & \sigma_{22} \\ \end{bmatrix}$ . Jakie jest prawdopodobieństwo $\Pr\left(X<Y|\min\left(X,Y\right)\right)$ ?

probability normal-distribution conditional-probability

— mikrofon
źródło

@ Whuber właśnie dzięki, usunąłem moje myśli, ponieważ nic tu nie dodają.

— AdamO,

\frac{P r (m < Y | X = m)}{P r (m < Y | X = m) + P r (m < X | Y = m)}

$\frac{Pr(m<Y|X=m)}{Pr(m<Y|X=m)+Pr(m<X|Y=m)}$

— Sextus Empiricus

przydatny link stats.stackexchange.com/questions/30588/… Czy to pytanie do samodzielnej nauki?

— Sextus Empiricus

Powinieneś podzielić się swoimi przemyśleniami na temat problemu, niezależnie od tego, że wygląda to na pytanie do samodzielnej nauki.

— StubbornAtom

Odpowiedzi:

Używając nieco bardziej wyraźnego zapisu , gdzie jest liczbą rzeczywistą, a nie zmienną losową. Zbiór, w którym jest ścieżką w kształcie litery L z dwoma półotwartymi segmentami: jeden biegnie prosto w górę od punktu a drugi idzie prosto w prawo od tego samego punktu. Oczywiste jest, że na nodze pionowej i na nodze poziomej . $P(X<Y|\min(X, Y)=m)$ $m$ $\min(X,Y) = m$ $(m,m)$ $x<y$ $x>y$

Biorąc pod uwagę tę geometryczną intuicję, łatwo przepisać problem w równoważnej formie, gdzie w liczniku mamy tylko nogę pionową, gdzie a w mianowniku mamy sumę dwóch nóg. $x<y$

$P(X<Y|\min(X, Y)) = \frac{ \displaystyle P(m<Y|X=m) }{ \displaystyle P(m<Y|X=m) + P(m<X|Y=m) } \tag{1}$

Teraz musimy obliczyć dwa wyrażenia postaci . Takie warunkowe prawdopodobieństwa dwuwymiarowego rozkładu normalnego zawsze mają rozkład normalny z parametrami: $P(m<X|Y=m)$ $\mathcal{N}\left(\mu_{X|Y=m}, s^2_{X|Y=m}\right)$

$\mu_{X|Y=m} = \mu_1+\frac{\displaystyle \sigma_{12}}{\displaystyle \sigma_{22}}({m}-\mu_2) \tag{2}$

$s^2_{X|Y=m} = \sigma_{11}-\frac{\displaystyle \sigma_{12}^2}{\displaystyle \sigma_{22}} \tag{3}$

Zauważ, że w oryginalnej definicji problemu odnosiło się do elementów macierzy kowariancji, w przeciwieństwie do bardziej powszechnej konwencji używania dla odchylenia standardowego. Poniżej znajdziemy go bardziej wygodne w użyciu dla wariancji i dla odchylenia standardowego rozkład warunkowy. $\sigma_{ij}$ $\sigma$ $s^2$ $s$

Znając te dwa parametry, możemy obliczyć prawdopodobieństwo niż na podstawie funkcji rozkładu skumulowanego. $m<X$

$P(m<X|Y=m) = \Phi \left(\frac{\displaystyle \mu_{X;Y=m} -m}{\displaystyle s_{X;Y=m}} \right) \tag{4}$

mutatis mutandis , mamy podobne wyrażenie dla . Pozwolić $P(Y>m|X=m)$

$z_{X|Y=m} = \frac{\displaystyle \mu_{X;Y=m} - m}{\displaystyle s_{X;Y=m}} \tag{5}$

$z_{Y|X=m} = \frac{\displaystyle \mu_{Y;X=m} -m}{\displaystyle s_{Y;X=m}} \tag{6}$

Wtedy możemy pisać zwięźle kompletne rozwiązanie w zakresie tych dwóch wynikami: $z$

$P(X<Y|\min(X, Y)=m) = 1 - \frac{ \displaystyle \Phi(z_{X|Y=m}) }{ \displaystyle \Phi(z_{X|Y=m})+\Phi(z_{Y|X=m}) } \tag{7}$

Na podstawie kodu symulacji dostarczonego przez autora pytania możemy porównać ten wynik teoretyczny z wynikami symulowanymi:

— olooney
źródło

W (3) myślę, że lewa strona powinna mieć kwadrat, ponieważ jest to wariancja warunkowa, podczas gdy odchylenie standardowe jest używane później.

— Yves

Masz całkowitą rację @Yves i uważam, że moje ostatnie zmiany naprawiły ten problem. Dziękuję Ci.

— olooney,

@olooney, dziękuję za tę odpowiedź. Mogę śledzić pochodną i wydaje się poprawna. Próbowałem jednak zweryfikować (1) i (7) w symulacji, a wyniki były całkiem inne. Możesz zobaczyć mój kod R tutaj gist.github.com/mikeguggis/d041df05565f63f8be2c6c51f5cf8961

— mike

@mike, myślę, że wystąpił błąd znaku. Po ustaleniu tego wynik teoretyczny wydaje się zgadzać z wynikami symulacji. gist.github.com/olooney/e88a66d2d2fa7f2f0cd0d0dd6b708739

— olooney

@olooney, dobry połów. Nadal nie jestem w stanie zrozumieć, dlaczego dwie szacunki oparte na symulacji nie pasują (wiersze 30–32 w moim kodzie).

— Mike

Pytanie można przepisać, używając zmodyfikowanej wersji twierdzenia Bayesa (i nadużycia pojęcia dla ) $Pr$

\begin{aligned} P r (X < Y | m i n (X, Y) = m) & = \frac{P r (m i n (X, Y) = m | X < Y) P r (X < Y)}{P r (m i n (X, Y) = m | X < Y) P r (X < Y) + P r (m i n (X, Y) = m | X \geq Y) P r (X \geq Y)} \\ = \frac{P r (X < Y, m i n (X, Y) = m)}{P r (X < Y, m i n (X, Y) = m) + P r (X \geq Y, m i n (X, Y) = m)} . \end{aligned}

$\begin{align} Pr(X<Y|min(X,Y) = m) &= \frac{Pr(min(X,Y)=m|X<Y)Pr(X<Y)}{Pr(min(X,Y)=m|X<Y)Pr(X<Y)+Pr(min(X,Y)=m|X\geq Y)Pr(X\geq Y)}\\ &= \frac{Pr(X<Y,min(X,Y)=m)}{Pr(X<Y,min(X,Y)=m)+Pr(X\geq Y,min(X,Y)=m)}. \end{align}$

Zdefiniuj jako dwuwymiarowy plik PDF i , i . Następnie $f_{X,Y}$ $X$ $Y$ $\phi(x) = \frac{1}{\sqrt{2\pi}}exp(-\frac{1}{2}x^2)$ $\Phi(x) = \int_{-\infty}^x\phi(t)dt$

\begin{aligned} P r (X < Y, m i n (X, Y) = m) & = P r (X = m, Y > m) \\ = \int_{m}^{\infty} f_{X, Y} (m, t) d t \end{aligned}

$\begin{align} Pr(X<Y,min(X,Y)=m) &=Pr(X=m,Y>m) \\ &= \int_m^\infty f_{X,Y}(m,t)dt \end{align}$

\begin{aligned} P r (X \geq Y, m i n (X, Y) = m) & = P r (X \geq m, Y = m) \\ = \int_{m}^{\infty} f_{X, Y} (t, m) d t \end{aligned}

$\begin{align} Pr(X\geq Y,min(X,Y)=m) &=Pr(X\geq m,Y=m) \\ &= \int_m^\infty f_{X,Y}(t,m)dt \end{align}$

Używając normalności i definicji prawdopodobieństwa warunkowego, całki można przepisać jako

f_{X, Y} (m, t) = f_{Y | X} (t) f_{X} (m) = \frac{1}{\sqrt{σ_{Y | X}}} ϕ (\frac{t - μ_{Y | X}}{\sqrt{σ_{Y | X}}}) \frac{1}{\sqrt{σ_{11}}} ϕ (\frac{m - μ_{1}}{\sqrt{σ_{11}}})

$f_{X,Y}(m,t) = f_{Y|X}(t)f_X(m) = \frac{1}{\sqrt{\sigma_{Y|X}}}\phi\left(\frac{t-\mu_{Y|X}}{\sqrt{\sigma_{Y|X}}}\right)\frac{1}{\sqrt{\sigma_{11}}}\phi\left(\frac{m-\mu_1}{\sqrt{\sigma_{11}}}\right)$

f_{X, Y} (t, m) = f_{X | Y} (t) f_{Y} (m) = \frac{1}{\sqrt{σ_{X | Y}}} ϕ (\frac{t - μ_{X | Y}}{\sqrt{σ_{X | Y}}}) \frac{1}{\sqrt{σ_{22}}} ϕ (\frac{m - μ_{2}}{\sqrt{σ_{22}}}) .

$f_{X,Y}(t,m) = f_{X|Y}(t)f_Y(m) = \frac{1}{\sqrt{\sigma_{X|Y}}}\phi\left(\frac{t-\mu_{X|Y}}{\sqrt{\sigma_{X|Y}}}\right)\frac{1}{\sqrt{\sigma_{22}}}\phi\left(\frac{m-\mu_2}{\sqrt{\sigma_{22}}}\right).$

Gdzie

μ_{X | Y} = μ_{1} + \frac{σ_{12}}{σ_{22}} (m - μ_{2}),

$\mu_{X|Y} = \mu_1 + \frac{\sigma_{12}}{\sigma_{22}}(m-\mu_2),$

μ_{Y | X} = μ_{2} + \frac{σ_{12}}{σ_{11}} (m - μ_{1}),

$\mu_{Y|X} = \mu_2 + \frac{\sigma_{12}}{\sigma_{11}}(m-\mu_1),$

σ_{X | Y} = (1 - \frac{σ_{12}^{2}}{σ_{11} σ_{22}}) σ_{11}

$\sigma_{X|Y} = \left(1-\frac{\sigma_{12}^2}{\sigma_{11}\sigma_{22}}\right)\sigma_{11}$

σ_{Y | X} = (1 - \frac{σ_{12}^{2}}{σ_{11} σ_{22}}) σ_{22} .

$\sigma_{Y|X} = \left(1-\frac{\sigma_{12}^2}{\sigma_{11}\sigma_{22}}\right)\sigma_{22}.$

A zatem

P r (X < Y | m i n (X, Y) = m) = \frac{(1 - Φ (\frac{m - μ_{Y | X}}{\sqrt{σ_{Y | X}}})) \frac{1}{\sqrt{σ_{11}}} ϕ (\frac{m - μ_{1}}{\sqrt{σ_{11}}})}{(1 - Φ (\frac{m - μ_{Y | X}}{\sqrt{σ_{Y | X}}})) \frac{1}{\sqrt{σ_{11}}} ϕ (\frac{m - μ_{1}}{\sqrt{σ_{11}}}) + (1 - Φ (\frac{m - μ_{X | Y}}{\sqrt{σ_{X | Y}}})) \frac{1}{\sqrt{σ_{22}}} ϕ (\frac{m - μ_{2}}{\sqrt{σ_{22}}})} .

$\begin{equation} Pr(X<Y|min(X,Y) = m) = \frac{\left(1-\Phi\left(\frac{m-\mu_{Y|X}}{\sqrt{\sigma_{Y|X}}}\right)\right)\frac{1}{\sqrt{\sigma_{11}}}\phi\left(\frac{m-\mu_1}{\sqrt{\sigma_{11}}}\right)}{\left(1-\Phi\left(\frac{m-\mu_{Y|X}}{\sqrt{\sigma_{Y|X}}}\right)\right)\frac{1}{\sqrt{\sigma_{11}}}\phi\left(\frac{m-\mu_1}{\sqrt{\sigma_{11}}}\right)+\left(1-\Phi\left(\frac{m-\mu_{X|Y}}{\sqrt{\sigma_{X|Y}}}\right)\right)\frac{1}{\sqrt{\sigma_{22}}}\phi\left(\frac{m-\mu_2}{\sqrt{\sigma_{22}}}\right)}. \end{equation}$

Ta ostateczna forma jest bardzo podobna do wyniku, jaki uzyskał @olooney. Różnica polega na tym, że jego prawdopodobieństwa nie są ważone przez normalne gęstości.

Skrypt R do weryfikacji numerycznej można znaleźć tutaj

— mikrofon
źródło