Rozkład różnicy między dwoma rozkładami normalnymi


21

Mam dwie funkcje gęstości prawdopodobieństwa rozkładów normalnych:

f1(x1|μ1,σ1)=1σ12πe(xμ1)22σ12

i

f2(x2|μ2,σ2)=1σ22πe(xμ2)22σ22

Szukam funkcji gęstości prawdopodobieństwa separacji między i . Myślę, że to oznacza, że ​​szukam funkcji gęstości prawdopodobieństwa | x_1 - x_2 | . Czy to jest poprawne? Jak to znaleźć?x 2 | x 1 - x 2 |x1x2|x1x2|


Jeśli to zadanie domowe, użyj self-studytagu. Przyjmujemy pytania domowe, ale tutaj traktujemy je nieco inaczej.
shadowtalker,

Poza tym nie chcę być „tym facetem”, ale próbowałeś Google? „Różnica między normalnymi rozkładami” od razu znalazła odpowiedź.
shadowtalker,

@ssdecontrol nie, nie praca domowa, ale dotyczy projektu hobbystycznego, więc nie mam nic przeciwko, żebym sam musiał się czegoś dowiedzieć, jeśli trafię na właściwy tor. Próbowałem google, ale moje rozumienie tej sprawy jest tak ograniczone, że prawdopodobnie nie rozpoznałbym tego, gdyby było tuż przede mną. z cudzysłowami znalazłem wiele rzeczy podobnych do „jaka jest różnica między rozkładem normalnym a x” dla niektórych x.
Martijn,

Odpowiedzi:


26

Na to pytanie można odpowiedzieć, jak stwierdzono, zakładając, że dwie losowe zmienne i rządzone przez te rozkłady są niezależne. X1X2 To czyni ich różnicę Normalną ze średnią i wariancją . (Poniższe rozwiązanie można łatwo uogólnić na dowolny dwuwymiarowy Rozkład normalny .) Zatem zmiennaX=X2X1μ=μ2μ1σ2=σ12+σ22(X1,X2)

Z=Xμσ=X2X1(μ2μ1)σ12+σ22

ma standardowy rozkład normalny (tzn. z zerową średnią i wariancją jednostkową) i

X=σ(Z+μσ).

Ekspresja

|X2X1|=|X|=X2=σ(Z+μσ)2

wykazuje różnicę bezwzględną jako skalowaną wersję pierwiastka kwadratowego niecentralnego rozkładu chi-kwadrat z jednym stopniem swobody i parametrem niecentryczności . Niecentralny rozkład chi-kwadrat z tymi parametrami ma element prawdopodobieństwaλ=(μ/σ)2

f(y)dy=y2πe12(λy)cosh(λy)dyy, y>0.

Zapisanie dla x > 0 ustala zgodność jeden do jednego między y a pierwiastkiem kwadratowym, w wyniku czegoy=x2x>0y

f(y)dy=f(x2)d(x2)=x22πe12(λx2)cosh(λx2)dx2x2.

Uproszczenie tego, a następnie przeskalowanie o daje pożądaną gęstość,σ

f|X|(x)=1σ2πcosh(xμσ2)exp(x2+μ22σ2).

Ten wynik jest poparty symulacjami, takimi jak histogram 100 000 niezależnych losowań (zwany w kodzie „x”) o parametrach μ 1 = - 1 , μ 2 = 5 , σ 1 = 4 , σ 2 = 1 . Na nim jest wykreślony wykres f | X | , co dokładnie pokrywa się z wartościami histogramu.|X|=|X2X1|μ1=1,μ2=5,σ1=4,σ2=1f|X|

Figure

Poniżej przedstawiono Rkod tej symulacji.

#
# Specify parameters
#
mu <- c(-1, 5)
sigma <- c(4, 1)
#
# Simulate data
#
n.sim <- 1e5
set.seed(17)
x.sim <- matrix(rnorm(n.sim*2, mu, sigma), nrow=2)
x <- abs(x.sim[2, ] - x.sim[1, ])
#
# Display the results
#
hist(x, freq=FALSE)
f <- function(x, mu, sigma) {
 sqrt(2 / pi) / sigma * cosh(x * mu / sigma^2) * exp(-(x^2 + mu^2)/(2*sigma^2)) 
}
curve(f(x, abs(diff(mu)), sqrt(sum(sigma^2))), lwd=2, col="Red", add=TRUE)

Jak by to wyglądało inaczej, jeśli chcę uzyskać kwadratową różnicę? Na przykład, jeśli chcę ? (f1(.)f2(.))2
user77005,

1
@ user77005 Odpowiedź na to pytanie znajduje się w moim poście: jest to niecentralna dystrybucja chi-kwadrat. Kliknij link, aby uzyskać szczegółowe informacje.
whuber

22

Podaję odpowiedź, która jest komplementarna do odpowiedzi udzielonej przez @whuber w tym sensie, że może to napisać niestatystyk (tj. Ktoś, kto niewiele wie o niecentralnych rozkładach chi-kwadrat z jednym stopniem swobody itp.), i że neofita może podążać stosunkowo łatwo.

Pożyczając założenie niezależności, a także notację z odpowiedzi Whubera , gdzie μ = μ 1 - μ 2 i σ 2 = σ 2 1 + σ 2 2 . Zatem dla x 0 , F | Z | ( x )Z=X1X2N(μ,σ2)μ=μ1μ2σ2=σ12+σ22x0 oraz, oczywiście,C | Z | (x)=0dlax<0. Wynika to po rozróżnieniu względemx,że f | Z | ( x )

F|Z|(x)P{|Z|x}=P{xZx}=P{x<Zx}since Z is a continuous random variable=FZ(x)FZ(x),
F|Z|(x)=0x<0x
f|Z|(x)xF|Z|(x)=[fZ(x)+fZ(x)]1(0,)(x)=[exp((xμ)22σ2)σ2π+exp((x+μ)22σ2)σ2π]1(0,)(x)=exp(x2+μ22σ2)σ2π(exp(xμσ2)+exp(xμσ2))1(0,)(x)=1σ2πcosh(xμσ2)exp(x2+μ22σ2)1(0,)(x)
which is the exact same result as in whuber's answer, but arrived at more transparently.

1
+1 I always like to see solutions that work from the most basic possible principles and assumptions.
whuber

1

The distribution of a difference of two normally distributed variates X and Y is also a normal distribution, assuming X and Y are independent (thanks Mark for the comment). Here is a derivation: http://mathworld.wolfram.com/NormalDifferenceDistribution.html

Here you are asking the absolute difference, based on whuber's answer and if we assume the difference in mean of X and Y is zero, it's just a half normal distribution with two times the density (thanks Dilip for the comment).


3
You and Wolfram Mathworld are implicitly assuming that the 2 normal distributions (random variables) are independent. The difference is not even necessarily normally distributed if the 2 normal random variables are not bivariate normal, which can happen if they are not independent..
Mark L. Stone

4
In addition to the assumption pointed out by Mark, you are also ignoring the fact that the means are different. The half normal case works only when μ1=μ2 so that the difference has mean 0.
Dilip Sarwate

Thank you for your comments. Now I revised my answer based on your comments and whuber's answer.
yuqian
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.