Pytania otagowane jako resampling

Ponowne próbkowanie polega na pobraniu próbki z próbki. Typowe zastosowania to zbieranie próbek (przyjmowanie podpróbki, np. Wszystkie wartości oprócz 1) i ładowanie początkowe (pobieranie próbek z wymianą). Techniki te mogą zapewnić solidne oszacowanie rozkładu próbkowania, gdy jego wyprowadzenie analityczne byłoby trudne lub niemożliwe.

3
Jak ponownie próbkować w R bez powtarzania permutacji?
Czy w R, jeśli ustawię set.seed (), a następnie użyję przykładowej funkcji do losowej listy, czy mogę zagwarantować, że nie wygeneruję tej samej permutacji? to znaczy... set.seed(25) limit <- 3 myindex <- seq(0,limit) for (x in seq(1,factorial(limit))) { permutations <- sample(myindex) print(permutations) } To produkuje [1] 1 2 0 3 …


1
Metodologia bootstrap. Po co ponownie próbkować „z zastępstwem” zamiast losowego podpróbkowania?
Metoda bootstrap bardzo się rozpowszechniła w ostatnich latach, ja też jej często używam, zwłaszcza że rozumowanie jest dość intuicyjne. Ale tego nie rozumiem. Dlaczego Efron postanowił wykonać ponowne próbkowanie z zamianą zamiast zwykłego podpróbkowania przez losowe włączanie lub wyłączanie pojedynczych obserwacji? Myślę, że losowe podpróbkowanie ma jedną bardzo dobrą jakość, …

1
Granice współczynnika Giniego i granice błędów
Mam szereg czasowy danych o liczbie N = 14 w każdym punkcie czasowym i chcę obliczyć współczynnik Giniego i błąd standardowy dla tego oszacowania w każdym punkcie czasowym. Ponieważ mam tylko N = 14 zliczeń w każdym punkcie czasowym, przystąpiłem do obliczania wariancji scyzoryka, tj. z równania 7 Tomsona Ogwanga„Wygodna …

4
Dlaczego testy hipotez na ponownie próbkowanych zestawach danych zbyt często odrzucają wartość zerową?
tl; dr: Zaczynając od zestawu danych wygenerowanego pod wartością zerową, ponownie próbkowałem przypadki z zamianą i przeprowadzałem test hipotez na każdym zestawie danych ponownie próbkowanym. Te testy hipotez odrzucają zero w ponad 5% przypadków. W poniższej, bardzo prostej symulacji, generuję zestawy danych za pomocą X∼N(0,1)⨿Y∼N(0,1)X∼N(0,1)⨿Y∼N(0,1)X \sim N(0,1) \amalg Y \sim …

2
Czy powinienem uruchomić system na poziomie klastra czy na poziomie indywidualnym?
Mam model przeżycia z pacjentami zagnieżdżonymi w szpitalach, który zawiera losowy efekt dla szpitali. Efekt losowy rozkłada się w zależności od promieniowania gamma i staram się opisać „trafność” tego terminu w skali, która jest łatwa do zrozumienia. Znalazłem następujące odniesienia, które wykorzystują Medianę Hazard Ratio (trochę jak Median Ratio), i …

2
Dobry tekst do ponownego próbkowania?
Czy grupa może polecić dobry tekst / zasób wprowadzający do zastosowanych technik ponownego próbkowania? W szczególności interesują mnie alternatywy dla klasycznych testów parametrycznych (np. Testy t, ANOVA, ANCOVA) do porównywania grup w przypadku wyraźnego naruszenia założeń takich jak normalność. Przykładowy typ problemu, który chciałbym nauczyć się lepszego sposobu rozwiązania, może …

1
Który model głębokiego uczenia może klasyfikować kategorie, które nie wykluczają się wzajemnie
Przykłady: w opisie stanowiska mam zdanie: „Starszy inżynier Java w Wielkiej Brytanii”. Chcę użyć modelu głębokiego uczenia się, aby przewidzieć go jako 2 kategorie: English i IT jobs. Jeśli użyję tradycyjnego modelu klasyfikacji, może on przewidzieć tylko 1 etykietę z softmaxfunkcją na ostatniej warstwie. Dlatego mogę użyć 2 modelowych sieci …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Rozmiar próbek bootstrap
Uczę się o ładowaniu jako sposobie szacowania wariancji przykładowej statystyki. Mam jedną podstawową wątpliwość. Cytowanie z http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Ile obserwacji powinniśmy przeskalować ponownie? Dobrą sugestią jest pierwotna wielkość próby. Jak możemy ponownie próbkować tyle obserwacji, ile w oryginalnej próbce? Jeśli mam próbkę o wielkości 100 i próbuję oszacować wariancję …

1
Nadpróbkowanie przy pomocy zmiennych kategorialnych
Chciałbym przeprowadzić kombinację nadpróbkowania i podpróbkowania, aby zrównoważyć mój zestaw danych z około 4000 klientami podzielonymi na dwie grupy, gdzie jedna z grup ma udział około 15%. Zajrzałem do SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) i ROSE ( http://cran.r-project.org/web/packages/ROSE/ ROSE.pdf ), ale oba tworzą nowe próbki syntetyczne na podstawie istniejących obserwacji i …

1
Czy można użyć ponownego próbkowania bootstrap do obliczenia przedziału ufności dla wariancji zestawu danych?
Wiem, że jeśli powtórzysz próbkę z zestawu danych wiele razy i za każdym razem obliczysz średnią, średnie te będą zgodne z rozkładem normalnym (według CLT). W ten sposób można obliczyć przedział ufności na podstawie średniej zbioru danych, nie przyjmując żadnych założeń dotyczących rozkładu prawdopodobieństwa zbioru danych. Zastanawiałem się, czy możesz …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.