Masz rację sceptycznie podchodząc do tego podejścia. Metoda szeregowa Taylora nie działa ogólnie, chociaż heurystyka zawiera jądro prawdy. Podsumowując poniższą dyskusję techniczną,
- Silna koncentracja oznacza, że metoda szeregowa Taylora działa dla przyjemnych funkcji
- Sprawy mogą i pójdą drastycznie źle w przypadku dystrybucji o dużych rozmiarach lub niezbyt przyjemnych funkcji
Jak wskazuje odpowiedź Alecosa, sugeruje to, że metoda serii Taylora powinna zostać złomowana, jeśli dane mogą mieć ciężkie ogony. (Specjaliści od finansów, patrzę na ciebie.)
Jak zauważył Elvis, kluczowym problemem jest to, że wariancja nie kontroluje wyższych momentów . Aby zobaczyć dlaczego, uprośćmy twoje pytanie tak bardzo, jak to możliwe, aby przejść do głównej idei.
Załóżmy , że mamy ciąg zmiennych losowych z σ ( X n ) → 0 jako n → ∞ .Xnσ(Xn)→0n→∞
P: Czy możemy zagwarantować, że jak n → ∞ ?E[|Xn−μ|3]=o(σ2(Xn))n→∞?
Ponieważ są zmiennymi losowymi z drugich momentów skończonych i nieskończonych momentach trzecich, odpowiedź jest zdecydowanie nie . Dlatego generalnie metoda szeregowa Taylora zawodzi nawet w przypadku wielomianów 3 stopnia . Iteracja tego argumentu pokazuje, że nie można oczekiwać, że metoda szeregowa Taylora zapewni dokładne wyniki, nawet dla wielomianów, chyba że wszystkie momenty zmiennej losowej są dobrze kontrolowane.
Co zatem mamy zrobić? Z pewnością metoda ta działa dla ograniczonych zmiennych losowych, których obsługa jest zbieżna do punktu, ale ta klasa jest zdecydowanie zbyt mała, aby była interesująca. Załóżmy zamiast tego, że sekwencja pochodzi z bardzo skoncentrowanej rodziny, która spełnia (powiedzmy)Xn
P{|Xn−μ|>t}≤e−Cnt2(1)
dla każdego i niektórych C > 0 . Takie losowe zmienne są zaskakująco częste. Na przykład, gdy X n jest średnią empirycznąt>0C>0Xn
Xn:=1n∑i=1nYi
miłych zmiennych losowych (np. iid i ograniczone), różne nierówności stężenia sugerują, że X n spełnia (1). Standardowy argument (patrz p. 10 tutaj ) ogranicza p- te momenty dla takich zmiennych losowych:YiXnp
E[|Xn−μ|p]≤(p2Cn)p/2.
Dlatego dla każdego „wystarczająco miły” funkcja analityczna (patrz poniżej), możemy związany błędu E m na m -term Taylor serii zbliżenia, korzystając z nierówności trójkątafEmm
mim: = ∣∣∣∣E [f( Xn) ] - ∑p = 0mfa( p )( μ )p !E ( Xn- μ )p∣∣∣∣≤ 1( 2 ° Cn )( m + 1 ) / 2∑p = m + 1∞|f(p)(μ)|pp/2p!
gdy . Ponieważ przybliżenie Stirlinga daje p ! ≈ p p - 1 / 2 , błąd ściętego spełnia szereg Tayloran>C/2p!≈pp−1/2
mim= O ( n- ( m + 1 ) / 2) jako n → ∞kiedy tylko∑p = 0∞p(1−p)/2|f(p)(μ)|<∞.(2)
W związku z tym, gdy jest silnie stężony i f jest dostatecznie dobre, seria aproksymacja Taylora rzeczywiście dokładny. Nierówność występująca w (2) oznacza, że f ( p ) ( μ ) / p ! = O ( p - p / 2 ) , więc w szczególności nasz warunek wymaga, aby f było całkowite . Ma to sens, ponieważ (1) nie narzuca żadnych założeń dotyczących ograniczenia na X n .Xnff(p)(μ)/p!=O(p−p/2)fXn
Zobaczmy, co może pójść nie tak, gdy ma osobliwość (po komentarzu Whubera). Załóżmy, że wybieramy f ( x ) = 1 / x . Jeśli weźmiemy X n z N o r m a L ( 1 , 1 / n ) Rozkład obcięty od zera do dwóch, wówczas X brak jest wystarczającej koncentracji, e [ M ( X n ) ] = ∞ dla każdego nff(x)=1/xXnNormal(1,1/n)XnE[f(Xn)]=∞n. Innymi słowy, mamy wysoce skoncentrowaną, ograniczoną zmienną losową , a mimo to metoda szeregowa Taylora zawodzi, gdy funkcja ma tylko jedną osobliwość.
Kilka słów na temat dyscypliny. Uważam, że ładniej jest przedstawić warunek występujący w (2) jako wyprowadzony niż deus ex machina, który jest wymagany w rygorystycznym formacie twierdzenia / dowodu. Aby uczynić argument całkowicie rygorystycznym, należy najpierw zauważyć, że implikuje to prawa strona w (2)
E[|f(Xn)|]≤∑i=0∞|f(p)(μ)|p!E[|Xn−μ|p]<∞
przez tempo wzrostu chwil subgaussów z góry. Stąd twierdzenie Fubiniego
E[f(Xn)]=∑i=0∞f(p)(μ)p!E[(Xn−μ)p]
Reszta dowodu przebiega jak wyżej.