Różnica między dwiema zmiennymi losowymi logarytmicznymi

Niech i będą 2 iidrv, gdzie . Chciałbym poznać rozkład dla . $X_1$ $X_2$ $\log(X_1),\log(X_2) \sim N(\mu,\sigma)$ $X_1 - X_2$

Najlepsze, co mogę zrobić, to wziąć serię Taylora obu i przekonać się, że różnica jest sumą różnicy między dwoma normalnymi wartościami RV i dwoma wartościami kwadratowymi chi w uzupełnieniu do reszty różnicy między resztą wyrażeń. Czy istnieje prostszy sposób na uzyskanie rozkładu różnicy między 2 iid log-normal rv?

— frayedchef
źródło

Oto odpowiedni artykuł. Więcej artykułów znajdziesz w google! papers.ssrn.com/sol3/papers.cfm?abstract_id=2064829

— kjetil b halvorsen

Rzuciłem pobieżne spojrzenie na ten artykuł i wydaje się, że nie odpowiada on na moje pytanie w zadowalający sposób. Wydaje się, że zajmują się one liczbowymi przybliżeniami trudniejszego problemu znalezienia rozkładu sumy / różnicy między skorelowanymi lognormalnymi wartościami RV. Miałem nadzieję, że odpowiedź na niezależną sprawę będzie prostsza.

— frayedchef

W niezależnym przypadku może to być prostsza odpowiedź, ale nie prosta! Przypadek logarytmiczny jest znanym przypadkiem twardym --- funkcja generująca moment rozkładu logarytmicznego nie istnieje --- to znaczy nie zbiega się w otwartym przedziale zawierającym zero. Tak więc nie znajdziesz łatwego rozwiązania.

— kjetil b halvorsen

Rozumiem ... Czy podejście, które przedstawiłem powyżej, byłoby rozsądne? (tzn. jeśli

Y_{i} = \log (X_{i})

$Y_i = \log(X_i)$ ,

X_{1} - X_{2} \approx (Y_{1} - Y_{2}) + (Y_{1}^{2} - Y_{2}^{2}) / 2 + . . .

$X_1 - X_2 \approx (Y_1 - Y_2) + (Y_1^2 - Y_2^2)/2 + {} ...$ Czy wiemy coś o warunkach wyższego rzędu, lub jak je związać?

— frayedchef

Aby zilustrować trudność --- logarytmiczny mgf jest zdefiniowany tylko na

(- \infty, 0]

$(-\infty,0]$ . Aby oszacować rozkład różnic metodami saddlepoint, potrzebujemy (K = skumulowane gf)

K (s) + K (- s)

$K(s)+K(-s)$ , i ta suma jest zdefiniowana tylko w jednym punkcie, zero. Więc nie wydaje się działać. Suma lub średnia byłaby prostsza!

— kjetil b halvorsen

Odpowiedzi:

To trudny problem. Najpierw pomyślałem o użyciu (jakieś przybliżenie) funkcji generowania momentu w rozkładzie logarytmicznym. To nie działa, jak wyjaśnię. Ale najpierw trochę notacji:

Niech będzie standardową gęstością normalną, a odpowiednią funkcją rozkładu skumulowanego. Przeanalizujemy tylko rozkład logarytmiczny przypadku , który ma funkcję gęstości oraz funkcja skumulowanego rozkładu Załóżmy, że i są niezależnymi zmiennymi losowymi o powyższym rozkładzie logarytmicznym. Interesuje nas rozkład , który jest rozkładem symetrycznym ze średnią zero. Niech będzie funkcją generującą moment $\phi$ $\Phi$ $lnN(0,1)$

fa (x) = \frac{1}{\sqrt{2) π} x} {mi}^{- \frac{1}{2)} (\ln x)^{2)}}

$f(x)=\frac1{\sqrt{2\pi}x} e^{-\frac12 (\ln x)^2}$

fa (x) = Φ (\ln x)

$F(x) =\Phi(\ln x)$

X

$X$

Y

$Y$

D = X - Y

$D=X-Y$

M (t) = E e^{t X}

$M(t) = \DeclareMathOperator{\E}{E} \E e^{tX}$

X

$X$ . Jest on zdefiniowany tylko dla , więc nie jest zdefiniowany w przedziale otwartym zawierającym zero. Funkcja generowania momentu dla to . Zatem funkcja generowania momentu dla jest zdefiniowana tylko dla , więc nie jest bardzo przydatna.

t \in (- \infty, 0]

$t\in (-\infty,0]$

D

$D$

M_{D} (t) = E e^{t (X - Y)} = E e^{t X} E e^{- t Y} = M (t) M (- t)

$M_D(t)=\E e^{t(X-Y)}= \E e^{tX} \E e^{-tY}= M(t)M(-t)$

D

$D$

t = 0

$t=0$

Oznacza to, że będziemy potrzebować trochę bardziej bezpośrednie podejście do znajdowania przybliżeń dla podziału . Załóżmy, że , oblicz (a przypadek rozwiązany jest symetrycznie, otrzymujemy ). $D$ $t\ge 0$

\begin{aligned} P. (re \leq t) & = P. (X - Y \leq t) \\ = \int_{0}^{\infty} P. (X - y \leq t | Y = y) fa (y) re y \\ = \int_{0}^{\infty} P. (X \leq t + y) fa (y) re y \\ = \int_{0}^{\infty} fa (t + y) fa (y) re y \end{aligned}

$\begin{align} P(D \le t) &= P(X-Y\le t) \\ &= \int_0^\infty P(X-y\le t | Y=y) f(y) \; dy \\ &= \int_0^\infty P(X\le t+y) f(y) \; dy \\ &= \int_0^\infty F(t+y) f(y) \; dy \end{align}$

t < 0

$t<0$

P (D \leq t) = 1 - P (D \leq | t |)

$P(D\le t)=1-P(D\le |t|)$

To wyrażenie może być użyte do integracji numerycznej lub jako podstawa symulacji. Najpierw test:

 integrate(function(y) plnorm(y)*dlnorm(y), lower=0,  upper=+Inf)
  0.5 with absolute error < 2.3e-06

co jest wyraźnie poprawne. Podsumujmy to w funkcji:

pDIFF  <-  function(t) {
    d  <-  t
    for (tt in seq(along=t)) {
        if (t[tt] >= 0.0) d[tt] <- integrate(function(y) plnorm(y+t[tt])*dlnorm(y),
                                         lower=0.0,  upper=+Inf)$value else
                          d[tt] <- 1-integrate(function(y) plnorm(y+abs(t[tt]))*dlnorm(y),
                                         lower=0.0, upper=+Inf)$value
    }
    return(d)
}

> plot(pDIFF,  from=-5,  to=5)

co daje:

Następnie możemy znaleźć funkcję gęstości, różnicując pod znakiem całki, uzyskując

dDIFF  <-  function(t) {
       d  <- t; t<- abs(t)
       for (tt in seq(along=t)) {
           d[tt]  <-  integrate(function(y) dlnorm(y+t[tt])*dlnorm(y),
                                lower=0.0,  upper=+Inf)$value
       }
       return(d)
}

który możemy przetestować:

> integrate(dDIFF,  lower=-Inf,  upper=+Inf)
0.9999999 with absolute error < 1.3e-05

I wykreślając gęstość otrzymujemy:

plot(dDIFF,  from=-5,  to=5)

Próbowałem też uzyskać jakieś przybliżenie analityczne, ale jak dotąd nie udało się, nie jest to łatwy problem. Ale integracja numeryczna, jak wyżej, zaprogramowana w R jest bardzo szybka na nowoczesnym sprzęcie, więc jest dobrą alternatywą, która prawdopodobnie powinna być używana znacznie więcej.

— kjetil b halvorsen
źródło

To nie odpowiada ściśle na twoje pytanie, ale czy nie byłoby łatwiej spojrzeć na stosunek i ? Następnie po prostu docierasz do $X$ $Y$

\begin{aligned} Pr (\frac{X}{Y} \leq t) & = Pr (\log (\frac{X}{Y}) \leq \log (t)) \\ = Pr (\log (X) - \log (Y) \leq \log (t)) \\ \sim N. (0, 2) σ^{2)}) \end{aligned}

$\begin{align} \Pr\left(\frac{X}{Y} \leq t\right) &= \Pr\left(\log\left(\frac{X}{Y}\right) \leq \log(t) \right) \\ &= \Pr(\log(X) - \log(Y) \leq \log(t)) \\ &\sim \mathcal{N}(0, 2 \sigma^2) \end{align}$

W zależności od zastosowania może to służyć Twoim potrzebom.

— Vincent Traag
źródło

Ale czy nie patrzymy na XY zamiast log (X) - log (Y)?

— Sextus Empiricus

Tak oczywiście. Dzieje się tak na wypadek, gdyby ktoś był zainteresowany dowiedzieć się, jak dwie logarytmiczne zmienne różnią się od siebie, niekoniecznie musi to być różnica. Dlatego też mówię, że to nie odpowiada na pytanie.

— Vincent Traag