Badanie symulacyjne: jak wybrać liczbę iteracji?

Chciałbym wygenerować dane za pomocą „Modelu 1” i dopasować je do „Modelu 2”. Podstawową ideą jest zbadanie właściwości odporności „Modelu 2”. Szczególnie interesuje mnie wskaźnik pokrycia 95% przedziału ufności (w oparciu o normalne przybliżenie).

Jak ustawić liczbę uruchomień iteracji?
Czy to prawda, że większe niż konieczne replikacje mogą powodować fałszywe uprzedzenia? Jeśli tak, to jak to jest?

simulation monte-carlo

— użytkownik7064
źródło

Co rozumiesz przez „wskaźnik pokrycia 95% przedziału ufności”? Jeśli przedział ufności jest dokładny lub dobry przybliżony przedział, obejmuje on prawdziwą wartość parametru przez około 95% czasu.

— Michael R. Chernick,

Jeśli generujesz przedział ufności na podstawie modelu 2 dla danych wygenerowanych w modelu 1, wydaje się to wskazywać, że oba modele są powiązane i zawierają niektóre z tych samych parametrów. Czy możesz wyjaśnić coś więcej? Ponadto, kiedy mówisz „fałszywy” w drugim punkcie, masz na myśli zło, czy po prostu nieważne? Większa liczba symulacji nie powinna powodować błędu, ale może ujawnić błąd, który ma niewielkie praktyczne znaczenie, którego nie zobaczyłbyś przy mniejszej liczbie, podobny do tego, jak możesz wykryć (tj. Uzyskać znaczenie statystyczne) bardzo mały efekt, gdy mają bardzo dużą próbkę.

— Makro,

@Michael Chernick: Na przykład niedostateczne pokrycie można osiągnąć, jeśli błąd standardowy jest zbyt mały. Zredagowałem swoje pytanie, aby określić, niż korzystam z przedziałów ufności w oparciu o normalne przybliżenie.

— user7064,

@Macro: „Model 1” generuje normalne dane z terminami błędów heteroscedastycznych, a „Model 2” jest standardowym modelem liniowym.

— user7064,

Odpowiedzi:

W oparciu o komentarz uzupełniający wygląda na to, że próbujesz oszacować prawdopodobieństwo pokrycia przedziału ufności, gdy zakładasz stałą wariancję błędu, gdy prawdziwa wariancja błędu nie jest stała.

Myślę o tym, że dla każdego przebiegu przedział ufności albo obejmuje prawdziwą wartość, albo nie. Zdefiniuj zmienną wskaźnikową:

Y_{i} = {\begin{cases} 1 & i f t h e i n t e r v a l c o v e r s \\ 0 & i f i t d o e s n o t \end{cases}

$Y_i = \begin{cases} 1 & {\rm if \ the \ interval \ covers} \\ 0 & {\rm if \ it \ does \ not } \end{cases}$

Zatem prawdopodobieństwo pokrycia, które Cię interesuje, to które możesz oszacować na podstawie proporcji próbki, która, jak myślę, jest tym, co proponujesz. $E(Y_i) = p$

Jak ustawić liczbę uruchomień iteracji?

Wiemy, że wariancja próby Bernoulliego wynosi , a twoje symulacje wygenerują próby bernoulli IID, dlatego wariancja oszacowania podstawie symulacji wynosi , gdzie jest liczba symulacji. Możesz wybrać aby zmniejszyć tę wariancję tak bardzo, jak chcesz. Faktem jest, że $p(1-p)$ $p$ $p(1-p)/n$ $n$ $n$

p (1 - p) / n \leq 1 / 4 n

$p(1-p)/n \leq 1/4n$

Tak więc, jeśli chcesz wariancja jest mniejsza niż pewien uprzednio określony próg, , to można to zapewnić poprzez wybór . $\delta$ $n \geq 1/4\delta$

W bardziej ogólnym ustawieniu, jeśli próbujesz zbadać właściwości rozkładu próbkowania estymatora za pomocą symulacji (np. Jego średnia i wariancja), możesz wybrać liczbę symulacji na podstawie tego, ile precyzji chcesz osiągnąć w analogiczny sposób moda do opisanej tutaj.

Zauważ również, że gdy przedmiotem zainteresowania jest średnia (lub inny moment) zmiennej, tak jak tutaj, możesz skonstruować dla niej przedział ufności na podstawie symulacji z wykorzystaniem przybliżenia normalnego (tj. Centralnego twierdzenia o granicy) , jak omówiono w ładnej odpowiedzi MansT. To normalne przybliżenie jest lepsze wraz ze wzrostem liczby próbek, więc jeśli planujesz skonstruować przedział ufności, odwołując się do centralnego twierdzenia granicznego, będziesz chciał, aby było wystarczająco duże, aby to zastosować. Dla przypadku binarnego, jak masz tutaj wydaje się przybliżenie to jest dobre, nawet jeśli i są dość umiarkowane - powiedzmy, . $n$ $np$ $n(1-p)$ $20$

Czy to prawda, że większe niż konieczne replikacje mogą powodować fałszywe uprzedzenia? Jeśli tak, to jak to jest?

Jak wspomniałem w komentarzu - zależy to od tego, co rozumiesz przez fałszywe. Większa liczba symulacji nie spowoduje błędu systematycznego w sensie statystycznym, ale może ujawnić nieważne odchylenie, które jest zauważalne tylko przy astronomicznie dużej próbce. Załóżmy na przykład, że prawdziwe prawdopodobieństwo pokrycia błędnie określonego przedziału . W praktyce nie jest to jednak problemem, ale tę różnicę można zauważyć tylko wtedy, gdy przeprowadzisz mnóstwo symulacji. $94.9999\%$

— Makro
źródło

Często używam szerokości przedziałów ufności jako szybkiego i brudnego sposobu określania liczby potrzebnych iteracji.

$p$ $X$ $n$ $X\sim {\rm Bin}(n,p)$

$\hat{p}=X/n$ $p$ $\sqrt{p(1-p)/n}$ $n$ $\hat{p}$ $\hat{p}\pm 1.96\sqrt{\hat{p}(1-\hat{p})/n}$ $p$ $p\approx 0.95$ $2\cdot 1.96\sqrt{0.95\cdot 0.05/n}$

$0.1$ $n$

0,1 = 2) \cdot 1,96 \sqrt{0,95 \cdot 0,05 / n} .

$0.1=2\cdot 1.96\sqrt{0.95\cdot 0.05/n}.$

$n$

— MånsT
źródło

(+1) wygląda na to, że przesłaliśmy bardzo podobną odpowiedź w tym samym czasie, ale myślę, że inny użyty język może być przydatny dla niektórych.

— Makro,

Tak, nadal nie wiem, którą odpowiedź zaakceptować! W każdym razie +1 dla obu!

— user7064,

@Macro: +1 również dla Ciebie. Rozbieżność i szerokość przedziału są oczywiście mniej więcej równoważne. Wielkie umysły myślą podobnie - i nasze. ;)

— MånsT

n = (2 \cdot 1.65 \sqrt{0.95 \cdot 0.05} / 0.01)^{2}

$n=(2\cdot 1.65 \sqrt{0.95\cdot 0.05}/0.01)^2$

$\dfrac{\text{Population Standard Deviation}}{\sqrt{n}}$ $d$ $95\%$ $d= 1.96 \times \dfrac{\text{Pop.Std.Dev}}{\sqrt{n}}$ $n=\dfrac{ (1.96 \times\text{Pop.Std.Dev})^2}{d^2}$

Wykonanie większej liczby symulacji (przy założeniu, że wszystkie próbki są generowane przez losowy proces) nie ma wpływu na oszacowanie pod względem dokładności lub błędu.

$95\%$ $n$ $\dfrac{p(1-p)}{n}$

— Michael R. Chernick
źródło

Cześć Michał. Myślę, że ta odpowiedź nie ma sensu. OP próbuje zbadać, w jaki sposób zmieniają się właściwości pokrycia przedziału ufności, gdy założymy stałą wariancję, ale prawdziwa wariancja nie jest stała.

— Makro,

@Macro: Masz rację. Celowo umieszczam pytanie w szerszym kontekście, aby uniknąć odpowiedzi specyficznych dla problemu zakładania stałej wariancji.

— user7064,

@Macro To nie było pytanie, na które odpowiedziałem. Najwyraźniej wyjaśniono to później. Wydaje się również, że przedmiotem zainteresowania była dokładność przedziału ufności, który wykorzystuje normalne przybliżenie. Wydaje się, że nie ma na to odpowiedzi w żadnej z odpowiedzi.

— Michael R. Chernick,

@Michael, tak, wiem - chodziło mi o to, że ty (i ja) poprosiłeś o wyjaśnienia, ale nie czekałeś na wyjaśnienie przed opublikowaniem odpowiedzi. Re: Twój drugi komentarz, możesz w ten sposób zbadać właściwości pokrycia dowolnego przedziału, niezależnie od tego, czy było to oparte na normalnym przybliżeniu, czy nie. Jeśli uważasz, że istnieje coś innego do dodania, czego brakuje w istniejących odpowiedziach, edytuj swoją odpowiedź, abyśmy wszyscy mogli się uczyć.

— Makro,

@Macro Oczywiście się z tobą zgadzam. Zredagowałem swoją odpowiedź na rzecz PO. Podejrzewam, że w treści nie ma nic, czego byś nie wiedział.

— Michael R. Chernick,