Pytania otagowane jako sampling

Tworzenie próbek z dobrze określonej populacji przy użyciu metody probabilistycznej i / lub wytwarzanie liczb losowych z określonego rozkładu. Ponieważ ten tag jest niejednoznaczny, weź pod uwagę [badanie próbkowania] dla pierwszego i [monte-carlo] lub [symulacja] dla drugiego. W przypadku pytań dotyczących tworzenia losowych próbek ze znanych dystrybucji rozważ rozważ użycie tagu [random-generation].

2
Rozmiar próbek bootstrap
Uczę się o ładowaniu jako sposobie szacowania wariancji przykładowej statystyki. Mam jedną podstawową wątpliwość. Cytowanie z http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Ile obserwacji powinniśmy przeskalować ponownie? Dobrą sugestią jest pierwotna wielkość próby. Jak możemy ponownie próbkować tyle obserwacji, ile w oryginalnej próbce? Jeśli mam próbkę o wielkości 100 i próbuję oszacować wariancję …



4
Jak próbkować, gdy nie znasz dystrybucji
Jestem całkiem nowy w statystyce (garść kursów Uni dla początkujących) i zastanawiałem się nad próbkowaniem z nieznanych dystrybucji. W szczególności, jeśli nie masz pojęcia o podstawowej dystrybucji, czy jest jakiś sposób na „zagwarantowanie” otrzymania reprezentatywnej próbki? Przykład do zilustrowania: powiedz, że próbujesz ustalić globalny rozkład bogactwa. Dla każdej osoby możesz …

4
(interakcja) MCMC dla multimodalnego tylnej
Próbuję próbować z tyłu, mając wiele trybów szczególnie daleko od siebie za pomocą MCMC. Wygląda na to, że w większości przypadków tylko jeden z tych trybów zawiera 95% hpd, którego szukam. Próbowałem wdrożyć rozwiązania oparte na hartowanej symulacji, ale nie przynosi to zadowalających rezultatów, ponieważ w praktyce przejście z jednego …


1
Jak porównać obserwowane i oczekiwane zdarzenia?
Załóżmy, że mam jedną próbkę częstotliwości 4 możliwych zdarzeń: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 i mam spodziewane prawdopodobieństwo wystąpienia moich zdarzeń: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 Dzięki sumie obserwowanych częstotliwości moich czterech zdarzeń (18) mogę obliczyć …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 


3
Jak mogę zasymulować mikrodane ze spisu ludności dla małych obszarów za pomocą 1% próbki mikrodanych w dużej skali i zagregować statystyki w małej skali?
Chciałbym przeprowadzić analizę wielowymiarową na poziomie indywidualnym na małych poziomach agregacji geograficznej (dystrykty gromadzenia australijskiego spisu powszechnego). Oczywiście spis ludności nie jest dostępny na tych małych poziomach agregacji ze względu na prywatność, więc badam inne alternatywy. Prawie wszystkie zmienne będące przedmiotem zainteresowania są kategoryczne. Mam do dyspozycji dwa zestawy danych: …

3
Wskaźniki akceptacji dla Metropolis-Hastings z jednolitym rozkładem kandydatów
Kiedy działa algorytm Metropolis-Hastings z jednolitymi rozkładami kandydatów, jakie jest uzasadnienie posiadania współczynników akceptacji około 20%? Mam na myśli: po wykryciu prawdziwych (lub zbliżonych do prawdziwych) wartości parametrów, żaden nowy zestaw wartości parametrów kandydujących z tego samego jednolitego przedziału nie zwiększyłby wartości funkcji prawdopodobieństwa. Dlatego im więcej iteracji przeprowadzam, tym …




3
Jak ponownie próbkować szeregi czasowe XTS w R?
Mam nieregularnie rozmieszczone XTSszeregi czasowe (z POSIXctwartościami typu indeksu). Jak mogę zbudować nową serię czasową próbkowaną z, powiedzmy, 10-minutowym interwałem, ale z każdym momentem próbki dopasowanym do rundy (13:00:00, 13:10:00, 13:20:00, ...) . Jeśli moment ponownego próbkowania nie spadnie dokładnie na oryginalną wartość serii, chcę wziąć poprzednią.

2
Pobieranie próbek z rozkładu dwuwymiarowego o znanej gęstości za pomocą MCMC
Próbowałem symulować z dwuwymiarowej gęstości p ( x , y)p(x,y)p(x,y)używając algorytmów Metropolis w R i nie miał szczęścia. Gęstość można wyrazić jako p ( y| x)p(x)p(y|x)p(x)p(y|x)p(x), gdzie p ( x )p(x)p(x) jest dystrybucją Singh-Maddala p ( x ) =qxa - 1bza( 1 + (xb)za)1 + qp(x)=aqxa−1ba(1+(xb)a)1+qp(x)=\dfrac{aq x^{a-1}}{b^a (1 + (\frac{x}{b})^a)^{1+q}} …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.