To bardzo interesujące pytanie, z niewielką dokumentacją w literaturze Monte Carlo, z wyjątkiem powiązania ze stratyfikacją i
Rao-Blackwellisation . Jest to prawdopodobnie spowodowane faktem, że obliczenia oczekiwanej wariancji warunkowej i wariancji oczekiwanej warunku są rzadko wykonalne.
Po pierwsze, załóżmy, że biegniesz R symulacje z πX, x1, ... ,xR i dla każdego symulowanego xrbiegniesz S. symulacje z πY| X=xr, y1 r, ... ,ys r. Twoje szacunki Monte Carlo są wtedy
δ( R , S) =1R S∑r = 1R∑s = 1S.fa(xr,yr s)
Wariancja tego oszacowania jest rozkładana w następujący sposób
var { δ( R , S) }=1R2)S.2)R var {∑s = 1S.fa(xr,yr s) }=1RS.2)varXmiY| X{∑s = 1S.fa(xr,yr s)∣∣xr} +1RS.2)miXvarY| X{∑s = 1S.fa(xr,yr s)∣∣xr}=1RS.2)varX{ SmiY| X[ f(xr, Y) |xr] } +1RS.2)miX[ SvarY| X{ f(xr, Y) |xr} ]=1RvarX{miY| X[ f(xr, Y) |xr] } +1R SmiX[varY| X{ f(xr, Y) |xr} ]=K.= R S1RvarX{miY| X[ f(xr, Y) |xr] } +1K.miX[varY| X{ f(xr, Y) |xr} ]
Dlatego jeśli chcemy zminimalizować tę wariancję, optymalnym wyborem jest
R = K. Implikując to
S.= 1. Z wyjątkiem sytuacji, gdy pierwszy warunek wariancji jest zerowy, w którym to przypadku nie ma to znaczenia. Jednak, jak omówiono w komentarzach, założenie
K.= R S jest nierealne, ponieważ nie uwzględnia produkcji jednego
xr [lub zakłada, że jest to bezpłatne].
Przyjmijmy teraz różne koszty symulacji i ograniczenie budżetowe R + a R S=b, co oznacza, że yrskoszt a razy więcej do symulacji niż xr„s. Tak więc powyższy rozkład wariancji
1RvarX{EY|X[f(xr,Y)|xr]}+1R(b−R)/aREX[varY|X{f(xr,Y)|xr}]
które można zminimalizować w
R tak jak
R∗=b/1+{aEX[varY|X{f(xr,Y)|xr}/varX{EY|X[f(xr,Y)|xr]}}1/2
[najbliższa liczba całkowita pod ograniczeniami
R≥1 i
S≥1], z wyjątkiem sytuacji, gdy pierwsza wariancja jest równa zero, w którym to przypadku
R=1. Kiedy
EX[varY|X{f(xr,Y)|xr}]=0, minimalna wariancja odpowiada maksimum
R, który prowadzi do
S=1 w obecnym formalizmie.
Należy również zauważyć, że to rozwiązanie należy porównać z rozwiązaniem symetrycznym, gdy jest wbudowana całka wewnętrzna X dany Y a całka zewnętrzna jest przeciwna do marginesu w Y (zakładając, że symulacje są również wykonalne w tej kolejności).
Ciekawym rozszerzeniem tego pytania byłoby rozważenie innej liczby symulacji S(xr) dla każdego symulowanego xr, w zależności od wartości varY|X{f(xr,Y)|xr}.