Statystyki i duże zbiory danych bootstrap

2

Jak skonstruować 95% przedział ufności różnicy między medianami?

Mój problem: randomizowane badanie równoległe w grupie z bardzo skośnym rozkładem pierwotnego wyniku. Nie chcę zakładać normalności i używać opartych na normach 95% CI (tj. Używając 1,96 X SE). Bez problemu wyrażam miarę tendencji centralnej jako mediany, ale moje pytanie brzmi: jak skonstruować 95% CI różnicy w medianach między dwiema …

27 confidence-interval bootstrap median clinical-trials

4

Dlaczego RANSAC nie jest najczęściej stosowany w statystykach?

Pochodząc z pola widzenia komputerowego, często stosowałem metodę RANSAC (Random Sample Consensus) do dopasowywania modeli do danych z wieloma wartościami odstającymi. Jednak nigdy nie widziałem, aby używali go statystycy i zawsze miałem wrażenie, że nie była uważana za metodę „statystycznie solidną”. Dlaczego to jest takie? Ma charakter losowy, co utrudnia …

26 outliers bootstrap robust

1

Czy istnieje wynik, który zapewnia, że bootstrap jest prawidłowy tylko wtedy, gdy statystyki są płynne?

W całym założeniu nasza statystyka jest funkcją niektórych danych która jest pobierana z funkcji dystrybucyjnej ; funkcja rozkładu empirycznego naszej próbki to . Więc to statystyka postrzegana jako zmienna losowa, a to wersja statystyki ładowania początkowego. Używamy jako odległości KSθ(⋅)θ(⋅)\theta(\cdot)X1,…XnX1,…XnX_1, \ldots X_nF θ ( F ) θ ( M ) …

25 probability mathematical-statistics bootstrap asymptotics consistency

1

Czy wielomian (1 / n,…, 1 / n) można scharakteryzować jako dyskretny Dirichlet (1, .., 1)?

To pytanie jest nieco niechlujne, ale w celu uzupełnienia tego uwzględnię kolorowe wykresy! Najpierw tło, a następnie pytanie. tło Załóżmy, że masz wymiarowy rozkład wielomianowy z jednakowymi probailitami w kategoriach . Niech będzie znormalizowanymi ( ) z tego rozkładu, to znaczy:nnnnnnπ=(π1,…,πn)π=(π1,…,πn)\pi = (\pi_1, \ldots, \pi_n)ccc (c1,…,cn)∼Multinomial(1/n,…,1/n)πi=cin(c1,…,cn)∼Multinomial(1/n,…,1/n)πi=cin(c_1, \ldots, c_n) \sim \text{Multinomial}(1/n, …

24 distributions bayesian bootstrap multinomial dirichlet-distribution

3

Cross-validation lub bootstrapping w celu oceny wydajności klasyfikacji?

Jaka jest najbardziej odpowiednia metoda próbkowania do oceny wydajności klasyfikatora na określonym zbiorze danych i porównania go z innymi klasyfikatorami? Cross-validation wydaje się być standardową praktyką, ale przeczytałem, że metody takie jak bootstrap .632 są lepszym wyborem. W następstwie: czy wybór metryki wydajności wpływa na odpowiedź (jeśli użyję AUC zamiast …

24 machine-learning classification predictive-models cross-validation bootstrap

2

Jak faktycznie działa ładowanie w R?

Patrzyłem na pakiet rozruchowy w R i chociaż znalazłem kilka dobrych starterów, jak go używać, to jeszcze nie znalazłem niczego, co dokładnie opisuje to, co dzieje się „za kulisami”. Na przykład w tym przykładzie przewodnik pokazuje, jak używać standardowych współczynników regresji jako punktu wyjścia do regresji bootstrapu, ale nie wyjaśnia, …

22 r regression bootstrap regression-coefficients

1

Bootstrapping kontra Bayesian Bootstrapping koncepcyjnie?

Mam problem ze zrozumieniem, czym jest proces ładowania bayesowskiego i czym różni się on od normalnego ładowania początkowego. A gdyby ktoś mógł zaoferować intuicyjny / konceptualny przegląd i porównanie obu, byłoby świetnie. Weźmy przykład. Powiedzmy, że mamy zestaw danych X, który jest [1,2,5,7,3]. Jeśli próbujemy z zamianą wiele razy, aby …

21 bayesian sampling bootstrap

1

Dwa sposoby wykorzystania bootstrap do oszacowania przedziału ufności współczynników w regresji

model liniowy do moich danych: yja= β0+ β1xja+ ϵja,ϵja∼ N.( 0 , σ2)) .yi=β0+β1xi+ϵi,ϵi∼N(0,σ2). y_{i}=\beta_{0}+\beta_{1}x_{i}+\epsilon_{i}, \quad\epsilon_{i} \sim N(0,\sigma^{2}). Chciałbym oszacować przedział ufności (CI) współczynników ( , ) za pomocą metody bootstrap. Istnieją dwa sposoby zastosowania metody ładowania początkowego: β 1β0β0\beta_{0}β1β1\beta_{1} Próbka sparowanego predyktora odpowiedzi: Losowo ponownie pary i zastosuj regresję …

21 regression bootstrap

2

Bootstrapping - czy najpierw muszę usunąć wartości odstające?

Przeprowadziliśmy test podziału nowej funkcji produktu i chcemy sprawdzić, czy wzrost przychodów jest znaczący. Nasze obserwacje zdecydowanie nie są normalnie rozpowszechniane (większość naszych użytkowników nie wydaje, a wśród tych, którzy to robią, jest mocno wypaczona w kierunku wielu małych wydawców i kilku bardzo dużych wydawców). Zdecydowaliśmy się na użycie ładowania …

19 bootstrap outliers

1

Zastosowanie standardowego błędu dystrybucji bootstrap

(w razie potrzeby zignoruj kod R, ponieważ moje główne pytanie jest niezależne od języka) Jeśli chcę spojrzeć na zmienność prostej statystyki (np. Średnia), wiem, że mogę to zrobić za pomocą teorii: x = rnorm(50) # Estimate standard error from theory summary(lm(x~1)) # same as... sd(x) / sqrt(length(x)) lub z bootstrap …

19 r bootstrap nonlinear-regression

3

Jak obliczyć przedział ufności średniej w próbce o rozkładzie innym niż normalny?

Jak obliczyć przedział ufności średniej w próbce o rozkładzie innym niż normalny? Rozumiem, że metody bootstrap są tutaj powszechnie stosowane, ale jestem otwarty na inne opcje. Podczas gdy szukam opcji nieparametrycznej, jeśli ktoś może mnie przekonać, że rozwiązanie parametryczne jest prawidłowe, byłoby dobrze. Rozmiar próbki wynosi> 400. Gdyby ktoś mógł …

19 confidence-interval nonparametric bootstrap descriptive-statistics skewness

2

Średnia próbki bootstrap a statystyki próbki

Powiedzmy, że mam próbkę i próbkę bootstrap z tej próbki dla stastitic (np. Średnia). Jak wszyscy wiemy, że ta próbka bootstrap szacuje się podział próbkowania estymatora statystyki.χχ\chi Czy średnia dla tej próby ładowania początkowego jest lepszym oszacowaniem statystyki populacji niż statystyka oryginalnej próbki ? Na jakich warunkach tak by było?

18 estimation bootstrap

1

Użycie bootstrapu pod H0 do wykonania testu dla różnicy dwóch środków: zastąpienia w grupach lub w próbce zbiorczej

Załóżmy, że mam dane z dwoma niezależnymi grupami: g1.lengths <- c (112.64, 97.10, 84.18, 106.96, 98.42, 101.66) g2.lengths <- c (84.44, 82.10, 83.26, 81.02, 81.86, 86.80, 85.84, 97.08, 79.64, 83.32, 91.04, 85.92, 73.52, 85.58, 97.70, 89.72, 88.92, 103.72, 105.02, 99.48, 89.50, 81.74) group = rep (c ("g1", "g2"), c (length …

18 r hypothesis-testing bootstrap small-sample permutation-test

1

Przedział ufności oparty na bootstrapie

Studiując przedział ufności oparty na bootstrap, raz przeczytałem następujące oświadczenie: Jeśli rozkład bootstrapu jest przekrzywiony w prawo, przedział ufności oparty na bootstrapie zawiera korektę przesunięcia punktów końcowych jeszcze bardziej w prawo; może się to wydawać sprzeczne z intuicją, ale jest to prawidłowe działanie. Próbuję zrozumieć logikę leżącą u podstaw powyższego …

17 confidence-interval bootstrap

3

Dlaczego potrzebujemy ładowania początkowego?

Obecnie czytam „Wszystkie statystyki” Larry'ego Wassermana i zastanawia mnie coś, co napisał w rozdziale o szacowaniu funkcji statystycznych modeli nieparametrycznych. On napisał „Czasami możemy znaleźć szacowany błąd standardowy funkcji statystycznej, wykonując pewne obliczenia. Jednak w innych przypadkach nie jest oczywiste, jak oszacować błąd standardowy”. Chciałbym zaznaczyć, że w następnym rozdziale …

16 self-study estimation bootstrap standard-error

Pytania otagowane jako bootstrap