Jeszcze jedno centralne pytanie dotyczące limitu

11

Niech będzie sekwencją niezależnych zmiennych losowych Bernoulliego z Ustaw Pokaż, że zbiega się w rozkładzie do standardowej zmiennej normalnej gdy dąży do nieskończoności. $\{X_n:n\ge1\}$
$P {X_{k} = 1} = 1 - P {X_{k} = 0} = \frac{1}{k} .$ $P\{X_k=1\}=1-P\{X_k=0\}=\frac{1}{k}.$ $S_{n} = \sum_{k = 1}^{n} (X_{k} - \frac{1}{k}), B_{n}^{2} = \sum_{k = 1}^{n} \frac{k - 1}{k^{2}}$ $S_n=\sum^{n}_{k=1}\left(X_k-\frac{1}{k}\right), \ B_n^2=\sum^{n}_{k=1}\frac{k-1}{k^2}$ $\frac{S_n}{B_n}$ $Z$ $n$

Moja próba użycia CLT Lyapunova, dlatego musimy pokazać, że istnieje taka, że $\delta>0$

lim_{n \to \infty} \frac{1}{B_{n}^{2 + δ}} \sum_{k = 1}^{n} E [| X_{k} - \frac{1}{k} |^{2 + δ}] = 0.

$\lim_{n\rightarrow \infty}\frac{1}{B_n^{2+\delta}}\sum_{k=1}^{n}E[|X_k-\frac{1}{k}|^{2+\delta}]=0.$

Więc ustaw $\delta=1$

\sum_{k = 1}^{n} E {| X_{k} - k^{- 1} |}^{3} = \sum_{k = 1}^{n} (\frac{1}{k} - \frac{3}{k^{2}} + \frac{4}{k^{3}} - \frac{2}{k^{4}})

$\sum_{k=1}^{n}E\left|X_k-k^{-1}\right|^{3}=\sum_{k=1}^{n} \left(\frac{1}{k}-\frac{3}{k^2}+\frac{4}{k^3}-\frac{2}{k^4}\right)$ i

B_{n}^{3} = (\sum_{k = 1}^{n} \frac{1}{k} - \frac{1}{k^{2}}) \sqrt{(\sum_{k = 1}^{n} \frac{1}{k} - \frac{1}{k^{2}})}

$B_n^3=\left( \sum_{k=1}^n \frac{1}{k}-\frac{1}{k^2} \right) \sqrt{\left( \sum_{k=1}^n \frac{1}{k}-\frac{1}{k^2} \right)}$

Oceniając duże n na komputerze, pokazuje, w jaki sposób zarówno $\sum_{k=1}^{n}E|X_k-k^{-1}|^{3} \to \infty$ i $B_n^3 \to \infty$ jak $n \to \infty$ . Ale $B_n^3$ rośnie szybciej niż $B_n^2$ więc $\frac{\sum_{k=1}^{n}E|X_k-k^{-1}|^{3}}{B_n^3} \to 0$ . Czy ktoś może mi pomóc udowodnić, że ta konwergencja się utrzymuje?

probability convergence central-limit-theorem

— TiffanyButterfly
źródło

7

To jest przykład 27.3 prawdopodobieństwa i miary autorstwa Patrick Billingsley.

— Zhanxiong

10

Może to być pouczające, aby zademonstrować ten wynik na podstawie pierwszych zasad i podstawowych wyników , wykorzystując właściwości kumulatywnych funkcji generujących (dokładnie tak, jak w standardowych dowodach Twierdzenia o granicy centralnej). Wymaga to zrozumienia tempa wzrostu uogólnionych liczb harmonicznych dla Te szybkości wzrostu są dobrze znane i łatwe do uzyskania w porównaniu z całkami : są zbieżne dla a poza tym logarytmicznie rozchodzą się dla .

H (n, s) = \sum_{k = 1}^{n} k^{- s}

$H(n,s)=\sum_{k=1}^n k^{-s}$

s = 1, 2, \dots .

$s=1, 2, \ldots.$

\int_{1}^{n} x^{- s} d x

$\int_1^n x^{-s}dx$

s > 1

$s \gt 1$

s = 1

$s=1$

Niech i . Z definicji funkcja generowania skumulowanego (cgf) wynosi $n \ge 2$ $1 \le k \le n$ $(X_k - 1/k)/B_n$

ψ_{k, n} (t) = \log E (\exp (\frac{X_{k} - 1 / k}{B_{n}} t)) = - \frac{t}{k B_{n}} + \log (1 + \frac{- 1 + \exp (t / B_{n})}{k}) .

$\psi_{k,n}(t) = \log\mathbb{E}\left(\exp\left(\frac{X_k - 1/k}{B_n}t\right)\right) = -\frac{t}{k B_n} + \log\left(1 + \frac{-1 + \exp(t/B_n)}{k}\right).$

Rozwinięcie szeregu prawej strony, uzyskane z rozwinięcia wokół , przyjmuje postać $\log(1+z)$ $z=0$

ψ_{k, n} (t) = \frac{(k - 1)}{2 k^{2} B_{n}^{2}} t^{2} + \frac{k^{2} - 3 k + 2}{6 k^{3} B_{n}^{3}} t^{3} + \dots + \frac{k^{j - 1} - \dots \pm (j - 1)!}{j! k^{j} B_{n}^{j}} t^{j} + \dots .

$\psi_{k,n}(t) = \frac{(k-1)}{2 k^2 B_n^2}t^2 + \frac{k^2 - 3k + 2}{6 k^3 B_n^3} t^3 + \cdots + \frac{k^{j-1} - \cdots \pm (j-1)!}{j! k^j B_n^j}t^j + \cdots.$

Liczniki ułamków są wielomianami z wiodącym terminem . Ponieważ rozszerzenie dziennika jest całkowicie zbieżne dla , to rozszerzenie jest absolutnie zbieżne, kiedy $k$ $k^{j-1}$ $\left|\frac{-1 + \exp(t/B_n)}{k}\right| \lt 1$

| \exp (t / B_{n}) - 1 | < k .

$\left|\exp(t/B_n) - 1\right| \lt k.$

(W przypadku, gdy zbiega się wszędzie.) Dla ustalonej wartości i rosnących wartości (oczywista) rozbieżność oznacza, że dziedzina zbieżności absolutnej rośnie dowolnie duża. Zatem dla każdego stałego wystarczająco dużego ekspansja ta zbiega się absolutnie. $k=1$ $k$ $n$ $B_n$ $t$ $n$

Dla odpowiednio dużego możemy zatem zsumować indywidualny przez wyrażenie po terminie w potęgach aby otrzymać cgf , $n$ $\psi_{k,n}$ $k$ $t$ $S_n/B_n$

ψ_{n} (t) = \sum_{k = 1}^{n} ψ_{k, n} (t) = \frac{1}{2} t^{2} + \dots + \frac{1}{B_{n}^{j}} (\sum_{k = 1}^{n} (k^{- 1} - \dots \pm (j - 1)! k^{- j})) \frac{t^{j}}{j} + \dots .

$\psi_n(t) = \sum_{k=1}^n \psi_{k,n}(t) = \frac{1}{2}t^2 + \cdots + \frac{1}{B_n^j}\left(\sum_{k=1}^n \left(k^{-1} - \cdots \pm (j-1)!k^{-j}\right)\right)\frac{t^j}{j} + \cdots.$

Przyjmowanie terminów w sumach ponad pojedynczo wymaga oceny proporcjonalnych wyrażeń $k$

b (s, j) = \frac{1}{B_{n}^{j}} \sum_{k = 1}^{n} k^{- s}

$b(s,j) = \frac{1}{B_n^j}\sum_{k=1}^n k^{-s}$

dla i . Korzystając z asymptotyków uogólnionych liczb harmonicznych wspomnianych we wstępie, łatwo to wynika $j \ge 3$ $s=1, 2, \ldots, j$

B_{n}^{2} = H (n, 1) - H (n, 2) \sim \log (n)

$B_n^2 = H(n,1) - H(n,2) \sim \log(n)$

że

b (1, j) \sim (\log (n))^{1 - j / 2} \to 0

$b(1,j) \sim (\log(n))^{1-j/2}\to 0$

i (dla ) $s \gt 1$

b (s, j) \sim (\log (n))^{- j / 2} \to 0

$b(s,j) \sim (\log(n))^{-j/2}\to 0$

gdy rośnie. W związku z tym wszystkie terminy w rozwinięciu poza zbieżne do zera, skąd zbieżne do dla dowolnej wartości . Ponieważ zbieżność cgf implikuje zbieżność funkcji charakterystycznej, wnioskujemy z twierdzenia Levy'ego o ciągłości, że zbliża się do zmiennej losowej, której cgf wynosi 2/2 : jest to standardowa zmienna normalna, QED . $n$ $\psi_n(t)$ $t^2$ $\psi_n(t)$ $t^2/2$ $t$ $S_n/B_n$ $t^2/2$

Analiza ta odkrywa, jak delikatna jest zbieżność: podczas gdy w wielu wersjach Centralnego Twierdzenia Granicznego współczynnik wynosi (dla ), tutaj współczynnik wynosi tylko : zbieżność jest znacznie wolniejsza W tym sensie sekwencja standardowych zmiennych „ledwo” staje się Normalna. $t^j$ $O(n^{1-j/2})$ $j \ge 3$ $O(((\log(n))^{1-j/2})$

Tę powolną konwergencję możemy zobaczyć w serii symulacji. Histogramy wyświetlają niezależnych iteracji dla czterech wartości . Czerwone krzywe są wykresami standardowych funkcji gęstości normalnej do celów wizualnych. Chociaż ewidentnie istnieje stopniowa tendencja do normalności, nawet przy (gdzie jest wciąż znaczna), pozostaje znacząca nienormalność, o czym świadczy skośność (równa w tej próbce). (Nic dziwnego, że skośność tego histogramu jest zbliżona do , ponieważ właśnie tym jest termin w cgf.) $10^5$ $n$ $n=1000$ $(\log(n))^{-1/2} \approx 0.38$ $0.35$ $(\log(n))^{-1/2}$ $t^3$

Oto Rkod dla tych, którzy chcieliby dalej eksperymentować.

set.seed(17)
par(mfrow=c(1,4))
n.iter <- 1e5
for(n in c(30, 100, 300, 1000)) {
  B.n <- sqrt(sum(rev((((1:n)-1) / (1:n)^2))))
  x <- matrix(rbinom(n*n.iter, 1, 1/(1:n)), nrow=n, byrow=FALSE)
  z <- colSums(x - 1/(1:n)) / B.n
  hist(z, main=paste("n =", n), freq=FALSE, ylim=c(0, 1/2))
  curve(dnorm(x), add=TRUE, col="Red", lwd=2)
}

— Whuber
źródło

6

Masz już świetną odpowiedź. Jeśli chcesz również wypełnić własny dowód, możesz argumentować w następujący sposób:

Ponieważ zbieżne dla wszystkich i rozbieżne dla ( tutaj ), możemy napisać $\sum_{k=1}^n 1/k^i$ $i>1$ $i = 1$

\begin{aligned} S (n) := \sum_{k = 1}^{n} (\frac{1}{k} - \frac{3}{k^{2}} + \frac{4}{k^{3}} - \frac{3}{k^{4}}) = \sum_{k = 1}^{n} \frac{1}{k} + O (1) . \end{aligned}

$\begin{align}S(n):=\sum_{k=1}^n\left(\frac{1}{k} - \frac{3}{k^2} + \frac{4}{k^3} - \frac{3}{k^4} \right) = \sum_{k=1}^n\frac{1}{k} + O(1). \end{align}$

Tym samym argumentem

B_{n}^{2} = \sum_{k = 1}^{n} \frac{1}{k} + O (1) .

$B^2_n = \sum_{k=1}^n\frac{1}{k} + O(1).$

W konsekwencji a zatem $S(n) / B_n^2 = O(1)$

S (n) / B_{n}^{3} = O (1) (B_{n}^{2})^{- 1 / 2} \to 0,

$S(n)/B_n^3 = O(1)(B_n^2)^{-1/2} \to 0,$

co chcieliśmy pokazać.

— ekvall
źródło

2

Po pierwsze, zmienne losowe nie są identycznie rozmieszczone, jeśli rozkłady zależą od ;) $k$

Nie twojej notacji jako: $B_n$

wielkie litery są zwykle zarezerwowane dla zmiennych losowych.
to tylko suma wariancji, więc użyłbym notacji zawierającej symbol aby uczynić to oczywistym. $\sigma$

Jeśli chodzi o pytanie, nie wiem, czy jest to ćwiczenie, czy badanie i jakich narzędzi możesz użyć. Jeśli nie próbujesz ponownie udowodnić znanych twierdzeń, powiem tylko, że jest to centralne twierdzenie graniczne dla niezależnych, nie identycznie rozmieszczonych, ale równomiernie ograniczonych RV i nazwij to dniem. Nie mam dobrego źródła pod ręką, ale nie powinno być trudno go znaleźć, na przykład spójrz na /mathpro/29508/is-there-a-central-limit-theorem- for-granice-nie-identycznie-dystrybuowane-losowo .

Edycja: Mój zły, oczywiście, jednolicie ograniczony warunek nie wystarczy, potrzebujesz też

\sum_{k = 1}^{n} σ_{k}^{2} \to \infty

$\sum_{k=1}^n \sigma_k^2 \to \infty$

— Adrien
źródło