Statystyki i duże zbiory danych bootstrap

1

Korzystanie z bootstrap w celu uzyskania rozkładu próbkowania 1. percentyla

Mam próbkę (o wielkości 250) z populacji. Nie znam rozkładu populacji. Główne pytanie: Chcę estymację punktową o 1 st -percentile populacji, a następnie chcę 95% przedział ufności wokół mojego punktu oszacowania. Chodzi mi o oszacowanie będzie próbka 1 st -percentile. Oznaczam to .xxx Następnie staram się zbudować przedział ufności wokół …

9 confidence-interval bootstrap quantiles extreme-value

1

Jak interpretować zmienne wykluczone lub zawarte w modelu lasso?

Z innych postów wyciągnąłem wniosek, że nie można przypisywać „ważności” ani „znaczenia” zmiennym predykcyjnym wchodzącym w model lasso, ponieważ obliczanie wartości p lub odchyleń standardowych tych zmiennych jest wciąż w toku. Czy zgodnie z tym rozumowaniem słuszne jest stwierdzenie, że NIE MOŻNA powiedzieć, że zmienne WYŁĄCZONE z modelu lasso są …

9 statistical-significance bootstrap simulation lasso regression-strategies

1

Czy można użyć ponownego próbkowania bootstrap do obliczenia przedziału ufności dla wariancji zestawu danych?

Wiem, że jeśli powtórzysz próbkę z zestawu danych wiele razy i za każdym razem obliczysz średnią, średnie te będą zgodne z rozkładem normalnym (według CLT). W ten sposób można obliczyć przedział ufności na podstawie średniej zbioru danych, nie przyjmując żadnych założeń dotyczących rozkładu prawdopodobieństwa zbioru danych. Zastanawiałem się, czy możesz …

9 distributions confidence-interval bootstrap resampling

2

Wariancja średniej próbki próbki ładowania początkowego

Niech będą odrębnymi obserwacjami (bez powiązań). Niech oznacza próbkę bootstrap (próbka z empirycznego CDF) i niech . Znajdź i .X1,...,XnX1,...,XnX_{1},...,X_{n}X∗1,...,X∗nX1∗,...,Xn∗X_{1}^{*},...,X_{n}^{*}X¯∗n=1n∑ni=1X∗iX¯n∗=1n∑i=1nXi∗\bar{X}_{n}^{*}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*}E(X¯∗n)E(X¯n∗)E(\bar{X}_{n}^{*})Var(X¯∗n)Var(X¯n∗)\mathrm{Var}(\bar{X}_{n}^{*}) Do tej pory mam to, że to każdy z prawdopodobieństwem więc i co daje X∗iXi∗X_{i}^{*}X1,...,XnX1,...,XnX_{1},...,X_{n}1n1n\frac{1}{n}E(X∗i)=1nE(X1)+...+1nE(Xn)=nμn=μE(Xi∗)=1nE(X1)+...+1nE(Xn)=nμn=μ E(X_{i}^{*})=\frac{1}{n}E(X_{1})+...+\frac{1}{n}E(X_{n})=\frac{n\mu}{n}=\mu E(X∗2i)=1nE(X21)+...+1nE(X2n)=n(μ2+σ2)n=μ2+σ2,E(Xi∗2)=1nE(X12)+...+1nE(Xn2)=n(μ2+σ2)n=μ2+σ2,E(X_{i}^{*2})=\frac{1}{n}E(X_{1}^{2})+...+\frac{1}{n}E(X_{n}^{2})=\frac{n(\mu^{2}+\sigma^{2})}{n}=\mu^{2}+\sigma^{2}\>, Var(X∗i)=E(X∗2i)−(E(X∗i))2=μ2+σ2−μ2=σ2.Var(Xi∗)=E(Xi∗2)−(E(Xi∗))2=μ2+σ2−μ2=σ2. \mathrm{Var}(X_{i}^{*})=E(X_{i}^{*2})-(E(X_{i}^{*}))^{2}=\mu^{2}+\sigma^{2}-\mu^{2}=\sigma^{2} \>. Następnie and od ' są niezależne. To dajeE(X¯∗n)=E(1n∑i=1nX∗i)=1n∑i=1nE(X∗i)=nμn=μE(X¯n∗)=E(1n∑i=1nXi∗)=1n∑i=1nE(Xi∗)=nμn=μE(\bar{X}_{n}^{*})=E(\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*})=\frac{1}{n}\sum_{i=1}^{n}E(X_{i}^{*})=\frac{n\mu}{n}=\mu Var(X¯∗n)=Var(1n∑i=1nX∗i)=1n2∑i=1nVar(X∗i)Var(X¯n∗)=Var(1n∑i=1nXi∗)=1n2∑i=1nVar(Xi∗) \mathrm{Var}(\bar{X}_{n}^{*})=\mathrm{Var}(\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*})=\frac{1}{n^{2}}\sum_{i=1}^{n}\mathrm{Var}(X_{i}^{*})X∗iXi∗X_{i}^{*}Var(X¯∗n)=nσ2n2=σ2nVar(X¯n∗)=nσ2n2=σ2n\mathrm{Var}(\bar{X}_{n}^{*})=\frac{n\sigma^{2}}{n^{2}}=\frac{\sigma^{2}}{n} …

9 self-study variance bootstrap cdf conditional-expectation

1

Co to jest iteracyjny bootstrap? Jak to jest używane?

Ostatnio natknąłem się na wzmiankę o „podwójnym / potrójnym bootstrapie” lub „iteracyjnym bootstrapie”. Jak rozumiem, każda próbka bootstrapu jest ładowana ponownie. O co chodzi? Jak to jest używane?

9 bootstrap

3

Jak przetestować / udowodnić, że dane są zerowane?

Mam problem, który moim zdaniem powinien być prosty, ale nie mogę go pojąć. Patrzę na zapylanie nasion, mam rośliny (n = 36), które kwitną w klastrach, próbuję 3 kępy kwiatów z każdej rośliny i 6 strąków nasion z każdej grupy (łącznie 18 strąków nasion z każdej rośliny). Strąki mogą mieć …

9 r distributions bootstrap zero-inflation

2

Parametryczne, półparametryczne i nieparametryczne ładowanie początkowe dla modeli mieszanych

Z tego artykułu pochodzą następujące przeszczepy . Jestem nowicjuszem w bootstrapie i próbuję zaimplementować parametryczne, semiparametryczne i nieparametryczne bootstrapowanie dla liniowego modelu mieszanego z R bootpakietem. Kod R. Oto mój Rkod: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, …

9 r mixed-model bootstrap central-limit-theorem stable-distribution time-series hypothesis-testing markov-process r correlation categorical-data association-measure meta-analysis r anova confidence-interval lm r bayesian multilevel-analysis logit regression logistic least-squares eda regression notation distributions random-variable expected-value distributions markov-process hidden-markov-model r variance group-differences microarray r descriptive-statistics machine-learning references r regression r categorical-data random-forest data-transformation data-visualization interactive-visualization binomial beta-distribution time-series forecasting logistic arima beta-regression r time-series seasonality large-data unevenly-spaced-time-series correlation statistical-significance normalization population group-differences demography

1

Rozkład odwrotności współczynnika regresji

Załóżmy, że mamy model liniowy który spełnia wszystkie założenia regresji standardowej (Gaussa-Markowa). Interesuje nas .yi=β0+β1xi+ϵiyi=β0+β1xi+ϵiy_i = \beta_0 + \beta_1 x_i + \epsilon_iθ=1/β1θ=1/β1\theta = 1/\beta_1 Pytanie 1: Jakie założenia są konieczne, aby rozkład był dobrze zdefiniowany? byłoby ważne --- jakieś inne?θ^θ^\hat{\theta}β1≠0β1≠0\beta_1 \neq 0 Pytanie 2: Dodaj założenie, że błędy mają rozkład …

9 regression distributions maximum-likelihood bootstrap

1

Oszacować średni przedział ufności metodą bootstrap t lub po prostu bootstrap?

Szacując przedział ufności średniej, myślę, że można zastosować zarówno metodę ładowania początkowego, jak i nieparametryczną metodę ładowania początkowego, ale ta pierwsza wymaga nieco więcej obliczeń. Zastanawiam się, jakie są zalety i wady bootstrapu t względem normalnego nieparametrycznego bootstrapu? Dlaczego? Czy są jakieś odniesienia do wyjaśnienia tego?

9 confidence-interval bootstrap

4

Jak przeprowadzić wiele testów chi-kwadrat post-hoc na stole 2 X 3?

Mój zestaw danych obejmuje zarówno całkowitą śmiertelność, jak i przeżycie organizmu w trzech typach miejsc: przybrzeżnym, śródokanałowym i przybrzeżnym. Liczby w poniższej tabeli reprezentują liczbę witryn. 100% Mortality 100% Survival Inshore 30 31 Midchannel 10 20 Offshore 1 10 Chciałbym wiedzieć, czy liczba witryn, w których wystąpiła 100% śmiertelność, jest …

9 logistic multiple-comparisons chi-squared r text-mining clustering classification feature-selection unsupervised-learning time-series references mode hypothesis-testing confidence-interval bootstrap normal-distribution order-statistics correlation statistical-significance spss bayesian beta-binomial

1

Czy istnieje nazwa dla tego typu ładowania początkowego?

Rozważ eksperyment z wieloma ludzkimi uczestnikami, z których każdy jest mierzony wiele razy w dwóch warunkach. Model efektów mieszanych można sformułować (używając składni lme4 ) jako: fit = lmer( formula = measure ~ (1|participant) + condition ) Powiedzmy, że chcę wygenerować przedziały ufności ładowania początkowego dla prognoz tego modelu. Myślę, …

9 mixed-model bootstrap

1

Czy powinienem ponownie przetasować swoje dane?

Mamy zestaw próbek biologicznych, których uzyskanie było dość drogie. Przekazujemy te próbki przez serię testów w celu wygenerowania danych, które są wykorzystywane do budowy modelu predykcyjnego. W tym celu podzieliliśmy próbki na zestawy szkoleniowe (70%) i testowe (30%). Z powodzeniem stworzyliśmy model i zastosowaliśmy go na zestawie testowym, aby odkryć, …

9 classification modeling experiment-design cross-validation bootstrap

3

Jak tworzymy przedział ufności dla parametru testu permutacji?

Testy permutacyjne to testy istotności oparte na próbkach permutacyjnych losowo pobranych z oryginalnych danych. Próbki permutacji są rysowane bez zamiany, w przeciwieństwie do próbek bootstrap, które są rysowane z zamianą. Oto przykład, który zrobiłem w R prostego testu permutacji. (Twoje komentarze są mile widziane) Testy permutacyjne mają ogromne zalety. Nie …

9 confidence-interval bootstrap permutation-test

7

Gdziekolwiek ładowanie - czy ktoś może podać proste wyjaśnienie na początek?

Mimo kilku prób przeczytania o ładowaniu, zawsze uderzam w ścianę z cegieł. Zastanawiam się, czy ktoś może podać dość nietechniczną definicję ładowania początkowego? Wiem, że to nie jest możliwe na tym forum, aby zapewnić wystarczająco szczegółowo, aby umożliwić mi w pełni zrozumieć, ale delikatne pchnięcie w dobrym kierunku, z głównym …

9 nonparametric bootstrap intuition

1

Czy mogę podpróbkować duży zestaw danych przy każdej iteracji MCMC?

Problem: Chcę wykonać próbkowanie Gibbsa, aby wywnioskować trochę z tyłu na podstawie dużego zestawu danych. Niestety mój model nie jest bardzo prosty, dlatego próbkowanie jest zbyt wolne. Rozważałbym podejścia wariacyjne lub równoległe, ale zanim przejdę tak daleko ... Pytanie: Chciałbym wiedzieć, czy mógłbym losowo próbować (z zastępstwem) z mojego zbioru …

8 sampling bootstrap mcmc large-data gibbs

Pytania otagowane jako bootstrap