Definicja czasu autokorelacji (dla efektywnej wielkości próby)

23

Znalazłem w literaturze dwie definicje czasu autokorelacji słabo stacjonarnych szeregów czasowych:

τ_{za} = 1 + 2) \sum_{k = 1}^{\infty} ρ_{k} przeciw τ_{b} = 1 + 2) \sum_{k = 1}^{\infty} | ρ_{k} |

$\tau_a = 1+2\sum_{k=1}^\infty \rho_k \quad \text{versus} \quad \tau_b = 1+2\sum_{k=1}^\infty \left|\rho_k\right|$

gdzie to autokorelacja z opóźnieniem . $\rho_k = \frac{\text{Cov}[X_t,X_{t+h}]}{\text{Var}[X_t]}$ $k$

Jednym z zastosowań czasu autokorelacji jest znalezienie „efektywnej wielkości próby”: jeśli masz obserwacji szeregu czasowego i znasz jego czas autokorelacji , możesz udawać, że masz $n$ $\tau$

n_{eff} = \frac{n}{τ}

$n_\text{eff} = \frac{n}{\tau}$

niezależne próbki zamiast skorelowanych próbek w celu znalezienia średniej. Oszacowanie podstawie danych nie jest trywialne, ale można to zrobić na kilka sposobów (patrz Thompson 2010 ). $n$ $\tau$

Definicja bez wartości bezwzględnych, , wydaje się bardziej powszechna w literaturze; ale dopuszcza możliwość . Używając R i pakietu „coda”: $\tau_a$ $\tau_a<1$

require(coda)
ts.uncorr <- arima.sim(model=list(),n=10000)         # white noise 
ts.corr <- arima.sim(model=list(ar=-0.5),n=10000)    # AR(1)
effectiveSize(ts.uncorr)                             # Sanity check
    # result should be close to 10000
effectiveSize(ts.corr)
    # result is in the neighborhood of 30000... ???

Funkcja „efektywna wielkość” w „kodzie” wykorzystuje definicję czasu autokorelacji równoważną powyżej. Istnieje kilka innych pakietów R, które obliczają efektywną wielkość próbki lub czas autokorelacji, a wszystkie te, które próbowałem, dają wyniki zgodne z tym: proces AR (1) z ujemnym współczynnikiem AR ma próbki bardziej skuteczne niż skorelowane szereg czasowy. To wydaje się dziwne. $\tau_a$

Oczywiście nie może się to zdarzyć w definicji czasu autokorelacji. $\tau_b$

Jaka jest prawidłowa definicja czasu autokorelacji? Czy coś jest nie tak z moim rozumieniem efektywnych wielkości próbek? Powyższy wynik wydaje się, że musi być nieprawidłowy ... co się dzieje? $n_\text{eff} > n$

r time-series correlation

— andrewtinka
źródło

Żeby upewnić się, że nie zrozumiałem, czy to nie zamiast ?

C o v (X_{t}, X_{t + k})

$Cov(X_t,X_{t+k})$

h

$h$

— sachinruk

2

Interesuje mnie druga definicja, tj. . Czy możesz podać literaturę tam, gdzie ją znalazłeś?

τ_{b}

$\tau_b$

— Harry

17

Po pierwsze, odpowiednia definicja „efektywnej wielkości próby” jest powiązana z IMO z dość konkretnym pytaniem. Jeśli są identycznie rozmieszczone ze średnią i wariancji 1 empiryczną średnią $X_1, X_2, \ldots$ $\mu$

\hat{μ} = \frac{1}{n} \sum_{k = 1}^{n} X_{k}

$\hat{\mu} = \frac{1}{n} \sum_{k=1}^n X_k$

μ

$\mu$

n^{- 1}

$n^{-1}$

\hat{μ}

$\hat{\mu}$

\frac{1}{n^{2)}} \sum_{k, l = 1}^{n} Cov (X_{k}, X_{l}) = \frac{1}{n} (1 + 2) (\frac{n - 1}{n} ρ_{1} + \frac{n - 2)}{n} ρ_{2)} + \dots + \frac{1}{n} ρ_{n - 1})) ≃ \frac{τ_{za}}{n} .

$\frac{1}{n^2} \sum_{k, l=1}^n \text{cov}(X_k, X_l) = \frac{1}{n}\left(1 + 2\left(\frac{n-1}{n} \rho_1 + \frac{n-2}{n} \rho_2 + \ldots + \frac{1}{n} \rho_{n-1}\right) \right) \simeq \frac{\tau_a}{n}.$

n

$n$

n_{eff} = n / τ_{a}

$n_{\text{eff}} = n/\tau_a$

n_{eff}^{- 1}

$n_{\text{eff}}^{-1}$

n_{eff}

$n_{\text{eff}}$

n_{eff} = n / τ_{a}

$n_{\text{eff}} = n/\tau_a$

$n^{-1}$ $n_{\text{eff}} > n$

— NRH
źródło

2

Dla każdego, kto chce dowiedzieć się więcej na temat stosowania ujemnej korelacji w symulacji Monte Carlo, spróbuj googlingu „zmiennych antytetycznych”. Więcej informacji w notatkach do kursu tutaj lub tutaj .

— andrewtinka

1

patrz http://arxiv.org/pdf/1403.5536v1.pdf

i

https://cran.r-project.org/web/packages/mcmcse/mcmcse.pdf

dla efektywnej wielkości próbki. Myślę, że alternatywny preparat wykorzystujący stosunek wariancji próbki i asymptotycznej wariancji łańcucha Markowa przez średnią serii jest bardziej odpowiednim estymatorem.

— subhadip pal
źródło

4

Czy możesz rozwinąć treść tych linków? W tej chwili jest on zbyt krótki, aby odpowiedzieć na nasze standardy!

— kjetil b halvorsen