Dlaczego warto korzystać z parametrycznego ładowania początkowego?


14

Obecnie próbuję omówić niektóre kwestie dotyczące parametrycznego ładowania początkowego. Większość rzeczy jest prawdopodobnie trywialna, ale nadal myślę, że coś przeoczyłem.

Załóżmy, że chcę uzyskać przedziały ufności dla danych przy użyciu parametrycznej procedury ładowania początkowego.

Mam więc tę próbkę i zakładam, że jest normalnie dystrybuowana. Oszacowałbym wtedy wariancję i znaczyłbym i uzyskałem szacunkową dystrybucję , co oczywiście jest po prostu . m P N( m , v )v^m^P^N(m^,v^)

Zamiast próbkowania z tego rozkładu mogłem po prostu obliczyć kwantyle analitycznie i zrobić.

a) Wnioskuję: w tym trywialnym przypadku parametryczny bootstrap byłby taki sam jak obliczanie rzeczy w założeniu rozkładu normalnego?

Teoretycznie byłoby tak w przypadku wszystkich parametrycznych modeli ładowania początkowego, o ile tylko mogę obsłużyć obliczenia.

b) Wnioskuję: zastosowanie założenia określonego rozkładu przyniesie mi dodatkową dokładność w parametrycznym ładowaniu początkowym w stosunku do nieparametrycznego (jeśli jest to oczywiście poprawne). Ale poza tym po prostu to robię, ponieważ nie mogę obsłużyć obliczeń analitycznych i próbować symulować wyjście z tego?

c) Użyłbym tego również, jeśli obliczenia są „zwykle” wykonywane przy użyciu przybliżenia, ponieważ może to dałoby mi większą dokładność…?

Dla mnie korzyść z (nieparametrycznego) bootstrapu polegała na tym, że nie muszę zakładać żadnej dystrybucji. W przypadku parametrycznego ładowania początkowego ta przewaga zniknęła - czy są rzeczy, za którymi tęskniłem i gdzie parametryczny rozruch zapewnia przewagę nad rzeczami wymienionymi powyżej?


1
Zasadniczo masz rację - handlujesz błędem analitycznym za błąd Monte Carlo. Parametryczny bootstrap jest również przybliżoną próbką tylną.
probabilityislogic

1
masz na myśli przybliżoną próbkę tylną jak w bayesowskiej? nadal nie do końca rozumiem związek między bootstrapowaniem a oszacowaniem maksymalnego prawdopodobieństwa. ale to inna historia. Dziękuję za Twoją odpowiedź!
BootstrapBill

Odpowiedzi:


8

Tak. Masz rację. Ale parametryczny bootstrap chroni lepsze wyniki, gdy założenia są spełnione. Pomyśl o tym w ten sposób:

Mamy losowej próbie z rozkładu . Szacujemy parametr zainteresowania jako funkcję próbki, . Prognoza ta jest zmienną losową, więc ma rozkład nazywamy . Ten rozkład jest całkowicie określona przez i , co oznacza, . Wykonując dowolny rodzaj ładowania początkowego (parametryczne, nieparametryczne, ponowne próbkowanie), wykonujemy oszacowanie pomocą , aby uzyskać oszacowanie , . ZX1,,XnFθθ^=h(X1,,Xn)GhFG=G(h,F)FF^GG^=G(h,F^)G^oceniamy właściwości . To, co zmienia różne typy bootstrap, to sposób, w jaki otrzymujemy .θ^F^

Jeśli potrafisz analitycznie obliczyć , powinieneś to zrobić, ale ogólnie rzecz biorąc, jest to raczej trudne. Magia bootstrap jest to, że możemy wygenerować próbki z dystrybucją . W tym celu generujemy losowe próbki z rozkładem i obliczamy które nastąpi dystrybucji. G X b 1 ,...,X, B, n F θ b=h(X b 1 ,...,X b n ) GG^=G(h,F^)G^X1b,,XnbF^θ^b=h(X1b,,Xnb)G^

Gdy pomyślisz o tym w ten sposób, zalety parametrycznego ładowania początkowego są oczywiste. byłby lepszym przybliżeniem , wtedy byłby bliższy i wreszcie oszacowania właściwości byłyby lepsze. M G G θF^FG^Gθ^


1
Jeśli więc ujmujemy to w kategoriach zbieżności wyższego rzędu, widzimy, że chociaż parametryczny i nieparametryczny bootstrap mają ten sam porządek zbieżności (myślę, że tak napisano w statystyce asymptotycznej van der vaartsa), parametryczna jest wciąż lepsza. ale tylko pod względem jakiegoś czynnika?
BootstrapBill
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.