Pytania otagowane jako sampling

Tworzenie próbek z dobrze określonej populacji przy użyciu metody probabilistycznej i / lub wytwarzanie liczb losowych z określonego rozkładu. Ponieważ ten tag jest niejednoznaczny, weź pod uwagę [badanie próbkowania] dla pierwszego i [monte-carlo] lub [symulacja] dla drugiego. W przypadku pytań dotyczących tworzenia losowych próbek ze znanych dystrybucji rozważ rozważ użycie tagu [random-generation].

3
Klaster Big Data w R i czy próbkowanie jest istotne?
Jestem nowy w nauce o danych i mam problem ze znalezieniem klastrów w zestawie danych z 200 000 wierszy i 50 kolumnami w R. Ponieważ dane mają zarówno zmienne liczbowe, jak i nominalne, metody takie jak K-średnie, które wykorzystują euklidesową miarę odległości, nie wydają się właściwym wyborem. Zwracam się więc …

3
Oszacuj wielkość populacji, z której pobierana jest próbka, na podstawie liczby powtórzeń obserwacji
Powiedzmy, że mam populację 50 milionów unikalnych rzeczy i pobieram 10 milionów próbek (z wymianą) ... Pierwszy wykres, do którego załączyłem pokazuje, ile razy próbkuję tę samą „rzecz”, co jest stosunkowo rzadkie populacja jest większa niż moja próba. Jeśli jednak moja populacja liczy tylko 10 milionów rzeczy, a ja pobieram …

1
Sekwencja Haltona vs sekwencja Sobola?
Z odpowiedzi z poprzedniego pytania skierowano mnie w stronę sekwencji Haltona, aby stworzyć zestaw wektorów, które pokrywają równomiernie jednolitą przestrzeń próbki. Ale strona wikipedia wspomina, że ​​przede wszystkim wyższe liczby pierwsze są często silnie skorelowane na początku serii. Wydaje się, że dzieje się tak w przypadku każdej pary wysokich liczb …



3
Dlaczego kilka (jeśli nie wszystkie) testy hipotez parametrycznych zakładają losowe próbkowanie?
Testy takie jak Z, t i kilka innych zakładają, że dane są oparte na losowym próbkowaniu. Dlaczego? Załóżmy, że prowadzę badania eksperymentalne, w których bardziej zależy mi na wewnętrznej ważności niż na zewnętrznej. Tak więc, jeśli moja próbka może być nieco stronnicza, to dobrze, ponieważ zgodziłem się nie wywnioskować hipotezy …

2
Jak uzyskać rozkład normalny jako jeśli zakres wartości naszej zmiennej losowej jest ograniczony?
Powiedzmy, że mamy zmienną losową z zakresu wartości ograniczonego a , gdzie jest wartością minimalną i wartości maksymalnej.aaabbbaaabbb Powiedziano mi, że jako , gdzie jest naszą wielkością próby, rozkład próbkowania naszych średnich próbek jest rozkładem normalnym. Oznacza to, że wraz ze wzrostem zbliżamy się coraz bardziej do rozkładu normalnego, ale …

3
Ustal, czy proces rozproszenia ciężkiego ogona znacznie się poprawił
Obserwuję czasy przetwarzania procesu przed i po zmianie, aby dowiedzieć się, czy proces poprawił się przez zmianę. Proces poprawił się, jeśli czas przetwarzania został skrócony. Rozkład czasu przetwarzania jest gruby, dlatego porównanie na podstawie średniej nie jest rozsądne. Zamiast tego chciałbym wiedzieć, czy prawdopodobieństwo zaobserwowania krótszego czasu przetwarzania po zmianie …

1
Różnice między PROC Mixed i lme / lmer w R - stopnie swobody
Uwaga: to pytanie jest repost, ponieważ moje poprzednie pytanie musiało zostać usunięte ze względów prawnych. Porównując PROC MIXED z SAS z funkcją lmez nlmepakietu w R, natknąłem się na pewne dość mylące różnice. Mówiąc dokładniej, stopnie swobody w różnych testach różnią się między PROC MIXEDi lmezastanawiałem się, dlaczego. Zacznij od …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

2
Jak szybko próbkować X, jeśli exp (X) ~ Gamma?
Mam prosty problem z próbkowaniem, w którym moja wewnętrzna pętla wygląda następująco: v = sample_gamma(k, a) gdzie sample_gammapróbki z rozkładu gamma tworzą próbkę Dirichleta. Działa dobrze, ale w przypadku niektórych wartości k / a niektóre z niższych obliczeń są niedopełnione. Dostosowałem go do używania zmiennych przestrzeni dziennika: v = log(sample_gamma(k, …


2
Metody MCMC - wypalanie próbek?
W metodach MCMC wciąż czytam o burn-inczasie lub liczbie próbek "burn". Co to dokładnie jest i dlaczego jest potrzebne? Aktualizacja: Czy po stabilizacji MCMC pozostaje stabilny? W jaki sposób pojęcie burn-inczasu jest powiązane z czasem mieszania?
12 sampling  mcmc 

1
Intuicyjne przykłady ważnego próbkowania
Moje wykształcenie to informatyka. Jestem całkiem nowy w metodach próbkowania Monte Carlo i chociaż rozumiem matematykę, trudno mi znaleźć intuicyjne przykłady ważnego próbkowania. Dokładniej, czy ktoś mógłby podać przykłady: oryginalny rozkład, z którego nie można próbkować, ale można go oszacować rozkład ważności, z którego można pobrać próbki i odpowiedni dla …

3
Jak ponownie próbkować w R bez powtarzania permutacji?
Czy w R, jeśli ustawię set.seed (), a następnie użyję przykładowej funkcji do losowej listy, czy mogę zagwarantować, że nie wygeneruję tej samej permutacji? to znaczy... set.seed(25) limit <- 3 myindex <- seq(0,limit) for (x in seq(1,factorial(limit))) { permutations <- sample(myindex) print(permutations) } To produkuje [1] 1 2 0 3 …

1
Próbkowanie z rozkładu krańcowego przy użyciu rozkładu warunkowego?
Chcę próbkować z gęstości jednowymiarowej ale znam tylko związek:faXfXf_X faX( x ) = ∫faX| Y( x | y) fY( y) dy.fX(x)=∫fX|Y(x|y)fY(y)dy.f_X(x) = \int f_{X\vert Y}(x\vert y)f_Y(y) dy. Chcę uniknąć używania MCMC (bezpośrednio na reprezentacji całkowej), a ponieważ i są łatwe do próbkowania, myślałem o użyciu następującego próbnika :f Y ( …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.