Jaka jest oczekiwana wartość zmodyfikowanego rozkładu Dirichleta? (problem z integracją)


14

Łatwo jest stworzyć zmienną losową z rozkładem Dirichleta przy użyciu zmiennych Gamma o tym samym parametrze skali. Gdyby:

XiGamma(αi,β)

Następnie:

(X1jXj,,XnjXj)Dirichlet(α1,,αn)

Problem Co się stanie, jeśli parametry skali nie będą równe?

XiGamma(αi,βi)

Więc jaki jest rozkład tej zmiennej?

(X1jXj,,XnjXj)?

Dla mnie wystarczyłoby znać oczekiwaną wartość tego rozkładu.
Potrzebuję przybliżonej zamkniętej formuły algebraicznej, która może być bardzo szybko oceniona przez komputer.
Powiedzmy, że przybliżenie z dokładnością 0,01 jest wystarczające.
Możesz założyć, że:

αi,βiN

Uwaga W skrócie, zadaniem jest znalezienie przybliżenia tej całki:

f(α,β)=R+nx1jxjjβjαjΓ(αj)xjαj1eβjxjdx1dxn


1
@ Łukasz Możesz powiedzieć coś więcej na temat parametrów , α í i p ja ? Możliwe jest uzyskanie dokładnych wyrażeń dla j X j, a tym samym przybliżenie oczekiwań dla współczynników, ale dla niektórych kombinacji parametrów można wykorzystać przybliżenia normalne lub przybliżone przy mniejszym nakładzie pracy. Nie sądzę, aby istniała uniwersalna metoda aproksymacji, dlatego mile widziane byłyby dodatkowe ograniczenia. nαiβijXj
whuber

ij X j są skorelowane, więc musimy aproksymować samą całkę. α i jest często małą liczbą, taką jak 1 lub 2, a czasami tak dużą jak 10000. Podobnie z β i, ale zwykle jest 10 razy większa niż α i . X1jXjαiβiαi
Łukasz Lew

Problem dotyczy małych . Jeśli wszystkie α i są duże, dobrym przybliżeniem całej całki jest: α 1 / β 1αiαiα1/β1jαj/βj
Łukasz Lew

@ Łukasz Jeśli chcesz ocenić wyrażenie oczekiwań, dlaczego potrzebujesz formuły algebraicznej? Zastanawiam się nad zastosowaniem sztuczki numerycznej, aby uzyskać oczekiwanie, ale potrzebuję informacji zwrotnych :)
deps_stats

Muszę to oceniać wiele razy w moim programie. Musi być bardzo szybki, tzn. Bez pętli i najlepiej nie za dużo podziałów.
Łukasz Lew

Odpowiedzi:


2

Tylko wstępna uwaga, jeśli chcesz prędkości obliczeniowej, zwykle musisz poświęcić dokładność. „Większa dokładność” = „Ogólnie więcej czasu”. W każdym razie jest to przybliżenie drugiego rzędu, powinno poprawić się w stosunku do „przybliżonego” przybliżenia zasugerowanego w powyższym komentarzu:

E(XjiXi)E[Xj]E[iXi]cov[iXi,Xj]E[iXi]2+E[Xj]E[iXi]3Var[iXi]
=αjiβjβiαi×[11(iβjβiαi)+1(iαiβi)2(iαiβi2)]

EDIT An explanation for the above expansion was requested. The short answer is wikipedia. The long answer is given below.

write f(x,y)=xy. Now we need all the "second order" derivatives of f. The first order derivatives will "cancel" because they will all involve multiples XE(X) and YE(Y) which are both zero when taking expectations.

2fx2=0
2fxy=1y2
2fy2=2xy3

And so the taylor series up to second order is given by:

xyμxμy+12(1μy22(xμx)(yμy)+2μxμy3(yμy)2)

Taking expectations yields:

E[xy]μxμy1μy2E[(xμx)(yμy)]+μxμy3E[(yμy)2]

Which is the answer I gave. (although I initially forgot the minus sign in the second term)


This looks like exactly what I need. Can you explain how you got this expansion? I tried in a lot of ways and was unable to do that ...
Łukasz Lew
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.