Jednolita zmienna losowa jako suma dwóch zmiennych losowych

Zaczerpnięte z Grimmet i Stirzaker :

Pokaż, że nie może być tak, że $U=X+Y$ gdzie $U$ jest równomiernie rozmieszczone na [0,1], a $X$ i $Y$ są niezależne i identycznie rozmieszczone. Nie należy zakładać, że X i Y są zmiennymi ciągłymi.

Prosty dowód sprzeczności jest wystarczający dla przypadku, gdy $X$ , $Y$ są przyjmowane dyskretnie, argumentując, że zawsze można znaleźć $u$ i $u'$ takie, że $P(U\leq u+u') \geq P(U\leq u)$ podczas gdy $P(X+Y \leq u) = P(X+Y \leq u+u')$ .

Jednak ten dowód nie rozciąga się na $X,Y$ jest absolutnie ciągłe lub pojedynczo ciągłe. Wskazówki / komentarze / krytyka?

— prawoskrętny
źródło

Wskazówka : charakterystyczne funkcje są twoimi przyjaciółmi.

— kardynał

X i Y są identyczne, więc ich charakterystyczne funkcje muszą być identyczne. Musisz jednak użyć funkcji charakterystycznej, a nie funkcji generującej moment - nie ma gwarancji, że mgf istnieje dla X, więc pokazanie mgf ma niemożliwą właściwość nie oznacza, że nie ma takiego X. Wszystkie RV mają funkcję charakterystyczną, więc jeśli wykażesz, że ma niemożliwą właściwość, nie ma takiego X.

— Silverfish,

Jeśli rozkłady

X

$X$ i

Y

$Y$ mają jakiekolwiek atomy , powiedzmy, że

P {X = a} = P {Y = a} = b > 0

$P\{X=a\}=P\{Y=a\} = b > 0$ , to

P {X + Y = 2 a} \geq b^{2} > 0

$P\{X+Y=2a\} \geq b^2 > 0$ a więc

X + Y

$X+Y$ nie może być równomiernie rozłożone na

[0, 1]

$[0,1]$ . Dlatego nie trzeba rozważać przypadku rozkładów

X

$X$ i

Y

$Y$ zawierających atomy.

— Dilip Sarwate

Odpowiedzi:

Wynik można udowodnić za pomocą obrazu: widoczne szare obszary pokazują, że rozkład równomierny nie może zostać rozłożony jako suma dwóch niezależnych zmiennych o identycznym rozkładzie.

Notacja

Niech i będą takie, że ma równomierny rozkład na . Oznacza to, że dla wszystkich , $X$ $Y$ $X+Y$ $[0,1]$ $0\le a \le b \le 1$

Pr (a < X + Y \leq b) = b - a .

$\Pr(a < X+Y \le b) = b-a.$

Zasadniczą wsparcie wspólnego podziału i w związku z tym jest (w przeciwnym wypadku nie będzie dodatni prawdopodobieństwo, że leży poza ). $X$ $Y$ $[0,1/2]$ $X+Y$ $[0,1]$

Zdjęcie

Niech . Rozważ ten diagram pokazujący, jak obliczane są sumy zmiennych losowych: $0 \lt \epsilon \lt 1/4$

Postać

Podstawowym rozkładem prawdopodobieństwa jest łączny dla . Prawdopodobieństwo dowolnego zdarzenia jest podane przez całkowite prawdopodobieństwo pokryte przekątnym pasmem rozciągającym się między liniami i . Pokazane są trzy takie pasma: od do , pojawiające się jako mały niebieski trójkąt w lewym dolnym rogu; od do $(X,Y)$ $a \lt X+Y \le b$ $x+y=a$ $x+y=b$ $0$ $\epsilon$ $1/2-\epsilon$ , pojawiające się jako mały czerwony trójkąt w prawym górnym rogu. $1/2+\epsilon$ , pokazany jako szary prostokąt zakończony dwoma (żółtymi i zielonymi) trójkątami; i od do $1-\epsilon$ $1$

Co pokazuje obrazek

Porównując lewy dolny trójkąt na rysunku z lewym dolnym kwadratem zawierającym go i wykorzystując założenie iid dla i $X$ $Y$ , jasne jest, że

ϵ = Pr (X + Y \leq ϵ) < Pr (X \leq ϵ) Pr (Y \leq ϵ) = Pr (X \leq ϵ)^{2} .

$\epsilon = \Pr(X+Y \le \epsilon) \lt \Pr(X \le \epsilon)\Pr(Y \le \epsilon) = \Pr(X \le \epsilon)^2.$

Zauważ, że nierówność jest ścisła: równość nie jest możliwa, ponieważ istnieje pewne pozytywne prawdopodobieństwo, że zarówno jak i są mniejsze niż ale mimo to $X$ $Y$ $\epsilon$ $X+Y \gt \epsilon$ .

Podobnie, porównując czerwony trójkąt z kwadratem w prawym górnym rogu,

ϵ = Pr (X + Y > 1 - ϵ) < Pr (X > 1 / 2 - ϵ)^{2} .

$\epsilon = \Pr(X+Y \gt 1-\epsilon) \lt \Pr(X \gt 1/2-\epsilon)^2.$

Wreszcie porównanie dwóch przeciwnych trójkątów w lewym górnym i prawym dolnym rogu z pasmem ukośnym, który je zawiera, daje kolejną surową nierówność

2 ϵ < 2 Pr (X \leq ϵ) Pr (X > 1 / 2 - ϵ) < Pr (1 / 2 - ϵ < X + Y \leq 1 / 2 + ϵ) = 2 ϵ .

$2\epsilon \lt 2 \Pr(X\le \epsilon)\Pr(X \gt 1/2-\epsilon) \lt \Pr(1/2-\epsilon \lt X+Y \le 1/2+\epsilon) = 2\epsilon.$

Pierwsze Ensues nierówności z poprzednich dwóch (wziąć ich pierwiastkowania i pomnożyć je), podczas gdy drugi opisuje (ścisła) włączenie trójkątów w zespole i ostatnia równość wyraża równomierność . Wniosek, że jest sprzecznością dowodzącą, że i nie mogą istnieć, QED . $X+Y$ $2\epsilon \lt 2\epsilon$ $X$ $Y$

— whuber
źródło

(+1) Podoba mi się to podejście. Po odzyskaniu koperty z kosza na śmieci widzę, że narysowałem ten sam schemat, tyle że nie zaznaczyłem żółtych i zielonych trójkątów wewnątrz paska. Otrzymałem nierówności dla niebieskich i czerwonych trójkątów. Bawiłem się z nimi i kilkoma innymi prawdopodobieństwami, ale nigdy nie myślałem o zbadaniu prawdopodobieństwa paska, który okazał się krytycznym krokiem. Zastanawiam się, jaki proces myślowy mógł zmotywować ten wgląd?

— Silverfish,

W rzeczywistości, gdzie @ whuber ma żółte i zielone trójkąty, rysowałem na kwadratach (skutecznie rozkładałem

na siatkę). Patrząc na etapie, który "opisuje (surowe) włączenie trójkątów w paśmie",

[0, 0.5]^{2}

$[0, 0.5]^2$

2 Pr (X \leq ϵ) Pr (X > 1 / 2 - ϵ) < Pr (1 / 2 - ϵ < X + Y \leq 1 / 2 + ϵ)

$2 \Pr(X\le \epsilon)\Pr(X \gt 1/2-\epsilon) \lt \Pr(1/2-\epsilon \lt X+Y \le 1/2+\epsilon)$ , Zastanawiam się, czy byłoby to geometrycznie bardziej naturalne z kwadratami pokrywającymi pasmo niż trójkąty?

— Silverfish,

@Silver przypomniano mi o analizie sum równomiernych rozkładów, które zamieściłem kilka lat temu. To sugerowało wizualizację geometryczną sumy

Jest natychmiast oczywiste, że wiele prawdopodobieństwa musiał być skoncentrowane w pobliżu naroży

, aby suma być jednolite i stosunkowo mało prawdopodobne, aby znajdować się w pobliżu środkowego Diagonal

. Doprowadziło to do schematu, który opracowałem w Mathematica.

X + Y

$X+Y$

(0, 0)

$(0,0)$

(1 / 2, 1 / 2)

$(1/2,1/2)$

X + Y = 1 / 2

$X+Y=1/2$ W tym momencie odpowiedź napisała sama. Tak, używanie kwadratów w środkowym paśmie może być fajniejsze.

— whuber

Thanks! "Note that the inequality is strict: equality is not possible because there is some positive probability that either of

X

$X$ or

Y

$Y$ is less than

ϵ

$\epsilon$ but nevertheless

X + Y > ϵ

$X+Y \gt \epsilon$ ." I'm not sure I follow this. It seems to me the aim here is to show

Pr (X + Y \leq ϵ) < Pr (X \leq ϵ \cap Y \leq ϵ)

$\Pr(X+Y \le \epsilon) \lt \Pr(X \le \epsilon \cap Y \le \epsilon)$ , doesn't this require a positive probability for some event

A

$A$ in which both of

X

$X$ and

Y

$Y$ are less than or equal to

ϵ

$\epsilon$ and yet

X + Y > ϵ

$X + Y > \epsilon$ ? It is the "either of" vs "both of" I'm vacillating over.

— Silverfish

@Silverfish Thank you; I did not express that as I had intended. You are correct: the language is intended essentially to describe the portion of a little square not inside the triangle.

— whuber

I tried finding a proof without considering characteristic functions. Excess kurtosis does the trick. Here's the two-line answer: $\text{Kurt}(U) = \text{Kurt}(X + Y) = \text{Kurt}(X) / 2$ since $X$ and $Y$ are iid. Then $\text{Kurt}(U) = -1.2$ implies $\text{Kurt}(X) = -2.4$ which is a contradiction as $\text{Kurt}(X) \geq -2$ for any random variable.

Rather more interesting is the line of reasoning that got me to that point. $X$ (and $Y$ ) must be bounded between 0 and 0.5 - that much is obvious, but helpfully means that its moments and central moments exist. Let's start by considering the mean and variance: $\mathbb{E}(U)=0.5$ and $\text{Var}(U)=\frac{1}{12}$ . If $X$ and $Y$ are identically distributed then we have:

E (X + Y) = E (X) + E (Y) = 2 E (X) = 0.5

$\mathbb{E}(X + Y) = \mathbb{E}(X) + \mathbb{E}(Y) = 2 \mathbb{E}(X)= 0.5$

So $\mathbb{E}(X) = 0.25$ . For the variance we additionally need to use independence to apply:

Var (X + Y) = Var (X) + Var (Y) = 2 Var (X) = \frac{1}{12}

$\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) = 2 \text{Var}(X) = \frac{1}{12}$

Hence $\text{Var}(X) = \frac{1}{24}$ and $\sigma_X = \frac{1}{2\sqrt{6}} \approx 0.204$ . Wow! That is a lot of variation for a random variable whose support ranges from 0 to 0.5. But we should have expected that, since the standard deviation isn't going to scale in the same way that the mean did.

Now, what's the largest standard deviation that a random variable can have if the smallest value it can take is 0, the largest value it can take is 0.5, and the mean is 0.25? Collecting all the probability at two point masses on the extremes, 0.25 away from the mean, would clearly give a standard deviation of 0.25. So our $\sigma_X$ is large but not impossible. (I hoped to show that this implied too much probability lay in the tails for $X + Y$ to be uniform, but I couldn't get anywhere with that on the back of an envelope.)

Second moment considerations almost put an impossible constraint on $X$ so let's consider higher moments. What about Pearson's moment coefficient of skewness, $\gamma_1 = \frac{\mathbb{E}(X - \mu_X)^3}{\sigma_X^3} = \frac{\kappa_3}{\kappa_2^{3/2}}$ ? This exists since the central moments exist and $\sigma_X \neq 0$ . It is helpful to know some properties of the cumulants, in particular applying independence and then identical distribution gives:

κ_{i} (U) = κ_{i} (X + Y) = κ_{i} (X) + κ_{i} (Y) = 2 κ_{i} (X)

$\kappa_i(U) = \kappa_i(X + Y) = \kappa_i(X) + \kappa_i(Y) = 2\kappa_i(X)$

This additivity property is precisely the generalisation of how we dealt with the mean and variance above - indeed, the first and second cumulants are just $\kappa_1 = \mu$ and $\kappa_2 = \sigma^2$ .

Then $\kappa_3(U) = 2\kappa_3(X)$ and $\big(\kappa_2(U)\big)^{3/2} = \big(2\kappa_2(X)\big)^{3/2} = 2^{3/2} \big(\kappa_2(X)\big)^{3/2}$ . The fraction for $\gamma_1$ cancels to yield $\text{Skew}(U) = \text{Skew}(X + Y) = \text{Skew}(X) / \sqrt{2}$ . Since the uniform distribution has zero skewness, so does $X$ , but I can't see how a contradiction arises from this restriction.

So instead, let's try the excess kurtosis, $\gamma_2 = \frac{\kappa_4}{\kappa_2^2} = \frac{\mathbb{E}(X - \mu_X)^4}{\sigma_X^4} - 3$ . By a similar argument (this question is self-study, so try it!), we can show this exists and obeys:

Kurt (U) = Kurt (X + Y) = Kurt (X) / 2

$\text{Kurt}(U) = \text{Kurt}(X + Y) = \text{Kurt}(X) / 2$

The uniform distribution has excess kurtosis $-1.2$ so we require $X$ to have excess kurtosis $-2.4$ . But the smallest possible excess kurtosis is $-2$ , which is achieved by the $\text{Binomial}(1, \frac{1}{2})$ Bernoulli distribution.

— Silverfish
źródło

(+1) This is a quite clever approach, which was new to me. Thanks. Note that some of your analysis could have been streamlined by considering a uniform centered at zero. (The equivalence of the problem is immediate.) That would have immediately told you that considering skew was a dead-end.

— cardinal

@cardinal: I knew the skew was a dead-end before I worked on it. The purpose was expository: it's a self-study question so I didn't want to solve it in full! Rather I wanted to leave a hint on how to deal with the next level up...

— Silverfish

@cardinal: I was in two minds whether to center or not. I did back-of-envelope calculations more conveniently, but in the final analysis we just need (1) a simple case of the general result that

K u r t (X_{1} + . . . + X_{n}) = \frac{1}{n} K u r t (X)

$Kurt(X_1 + ... + X_n) = \frac{1}{n}Kurt(X)$ for iid

X_{i}

$X_i$ , (2) that

K u r t (U) = - 1.2

$Kurt(U) = -1.2$ for any uniform distribution, and (3)

K u r t (X)

$Kurt(X)$ exists since

X

$X$ is bounded and

σ_{X} \neq 0

$\sigma_X \neq 0$ (which is trivial, else

σ_{U} = 0

$\sigma_U = 0$ ). So none of the key results actually required centering, though bits may have looked less ugly!

— Silverfish

Yes, the word "streamlined" was carefully chosen. :-) I did not intend my comment to be read as criticism of your exposition. Cheers.

— cardinal

@cardinal Incidentally, variance considerations alone almost worked, but the uniform isn't quite spread out enough. With a bit more probability mass nearer the extremes, e.g.

f_{T} (t) = 12 t^{2}

$f_T(t)=12t^2$ on [-0.5, 0.5], then

V a r (T) = .15

$Var(T)=.15$ and if

T = X_{1} + X_{2}

$T = X_1 + X_2$ then

σ_{X} = \sqrt{.15 / 2} \approx 0.27 > 0.25

$\sigma_X = \sqrt{.15/2} \approx 0.27 > 0.25$ which is impossible as

X

$X$ is bounded by -0.25 and 0.25. Of course, you will see immediately how this relates to the present example! I wonder if the approach generalises, I'm sure other bounded RVs can't be decomposed into sums but require even higher moments investigated to find the contradiction.

— Silverfish