W całym założeniu nasza statystyka jest funkcją niektórych danych która jest pobierana z funkcji dystrybucyjnej ; funkcja rozkładu empirycznego naszej próbki to . Więc to statystyka postrzegana jako zmienna losowa, a to wersja statystyki ładowania początkowego. Używamy jako odległości KSF θ ( F ) θ ( M ) d ∞
Istnieją wyniki „tylko i tylko wtedy” dotyczące ważności bootstrapu, jeśli statystyka jest prostą statystyką liniową. Na przykład Twierdzenie 1 z Mammen „Kiedy działa bootstrap?”
Jeśli dla dowolnej dowolnej funkcji wówczas bootstrap działa w tym sensie, że jeśli i tylko jeśli istnieje i taki, że Gdzie możemy zdefiniować jako funkcję naszej próbki, aHnd∞[l(θ( F ) - T n),l(θ(F)-Tn)]→P0σntnd∞[L(θ(F)-tn)
^ t n t n = E ( t n )
Istnieją również bardziej ogólne wyniki, według których bootstrap działa dla statystyk ogólnych, na przykład Twierdzenie 1.6.3 z podpróbkowania autorstwa Politisa Romano i Wolfa:
Załóżmy, że jest pobierane z klasy wszystkich dystrybucji ze skończonym wsparciem. Załóżmy, że statystyka jest zmienna Frecheta w w odniesieniu do normy supremum, a pochodna spełnia . Wtedy jest asymptotycznie normalny, a bootstrap działa w sensie poprzedniego twierdzenia.θ ( ⋅ ) F g F 0 < Var F [ g F ( x ) ] < ∞ θ ( F )
Chciałbym wersję drugiego twierdzenia „jeśli i tylko jeśli”. Będzie to wymagało pojęcia gładkości innej niż różnicowanie Frecheta, ponieważ Politis, Romano i Wolf (1999) pokazują, że mediana próbki nie jest różnicowalna Frecheta, ale bootstrap nadal działa. Jednak mediana próbki nadal jest płynną funkcją danych.
W Mammen jest kilka nieformalnych komentarzy, że płynność jest konieczna:
Zazwyczaj lokalna asymptotyczna liniowość wydaje się być konieczna dla spójności bootstrapu
Cytat ma na celu:
van Zwet, W (1989). Dyskusja wygłoszona na konferencji „Metody asymptotyczne w komputerowych procedurach intensywnych w statystyce” w Olberwolfach.
Ale nie mogę znaleźć śladu tej rozmowy poza garstką cytatów.