Pytania otagowane jako sampling

Tworzenie próbek z dobrze określonej populacji przy użyciu metody probabilistycznej i / lub wytwarzanie liczb losowych z określonego rozkładu. Ponieważ ten tag jest niejednoznaczny, weź pod uwagę [badanie próbkowania] dla pierwszego i [monte-carlo] lub [symulacja] dla drugiego. W przypadku pytań dotyczących tworzenia losowych próbek ze znanych dystrybucji rozważ rozważ użycie tagu [random-generation].

4
Prawdopodobieństwo, że nie narysuje słowa z worka liter w Scrabble
Załóżmy, że masz torbę z płytkami, z których każda zawiera literę. Są kafelki z literą „A”, z „B” itd., I „symbole wieloznaczne” (mamy ). Załóżmy, że masz słownik ze skończoną liczbą słów. Z torby wybierasz płytek bez wymiany. Jak obliczysz (lub oszacujesz) prawdopodobieństwo, że możesz sformułować zero słów ze słownika, …

8
Jak oszacować, ile osób uczestniczyło w wydarzeniu (powiedzmy wiecu politycznym)?
Student zapytał mnie dzisiaj: „Skąd oni wiedzą, ile osób uczestniczyło w dużej grupie, na przykład„ Rajd Stewarta / Colberta, by przywrócić zdrowie psychiczne ”w Waszyngtonie?” Wiadomości przedstawiają szacunki w dziesiątkach tysięcy, ale jakie metody są używane do uzyskania tych szacunków i jak są one wiarygodne? Jeden artykuł najwyraźniej opierał swoje …

2
Rysunek z rozkładu Dirichleta
Załóżmy, że mamy rozkład Dirichleta z parametrem wektora wymiarowego . Jak narysować próbkę ( wektor wymiarowy) z tego rozkładu? Potrzebuję (możliwie) prostego wyjaśnienia.KKKα⃗ =[α1,α2,...,αK]α→=[α1,α2,...,αK]\vec\alpha = [\alpha_1, \alpha_2,...,\alpha_K]KKK

1
Wyjaśnienie skończonego współczynnika korygującego
Rozumiem, że gdy próbkowanie ze skończonej populacji, a nasza próbka stanowi więcej niż 5% populacji, musimy skorygować średni i standardowy błąd próby za pomocą tego wzoru: faP.do= N- nN.- 1----√FPC=N−nN−1\hspace{10mm} FPC=\sqrt{\frac{N-n}{N-1}} Gdzie to wielkość populacji, a to wielkość próby.nN.NNnnn Mam 3 pytania dotyczące tej formuły: Dlaczego próg wynosi 5%? Jak …


2
Paradoks danych ID (przynajmniej dla mnie)
Jeśli chodzi o moją kruszywa (i ograniczonych) wiedzy na statystykach zezwoleń, zrozumiałem, że jeśli X1,X2,...,XnX1,X2,...,XnX_1, X_2,..., X_n są IID zmiennymi losowymi, a następnie jako termin oznacza, że są niezależne i jednakowo rozdzielone. Moje obawy o to dawny majątek próbek IID, który brzmi: p(Xn|Xi1,Xi2,...,Xik)=p(Xn),p(Xn|Xi1,Xi2,...,Xik)=p(Xn),p(X_{n}|X_{i_1},X_{i_2},...,X_{i_k}) = p(X_{n}), dla dowolnej kolekcji różnych 's …


1
Czy próbkowanie w regresji logistycznej powinno odzwierciedlać rzeczywisty stosunek 1 i 0?
Załóżmy, że chcę stworzyć model regresji logistycznej, który może oszacować prawdopodobieństwo wystąpienia niektórych gatunków zwierząt żyjących na drzewach w oparciu o cechy drzew (np. Wysokość). Jak zawsze mój czas i pieniądze są ograniczone, dlatego jestem w stanie zebrać tylko ograniczoną liczbę próbek. Mam następujące pytania: Czy stosunek 1 do 0 …

2
Generowanie danych za pomocą danej macierzy kowariancji próbki
Biorąc pod uwagę macierz kowariancji ΣsΣs\boldsymbol \Sigma_s , w jaki sposób wygenerować dane, aby miała przykładową macierz kowariancji Σ^=ΣsΣ^=Σs\hat{\boldsymbol \Sigma} = \boldsymbol \Sigma_s ? Mówiąc bardziej ogólnie: często jesteśmy zainteresowani generowaniem danych z gęstości f(x|θ)f(x|θ) f(x \vert \boldsymbol\theta) , z danymi xxx podanymi parametrami wektorowymi θθ\boldsymbol\theta . Daje to próbkę, …

1
Dlaczego rozkład wariancji próbkowania jest rozkładem kwadratowym chi?
Wyrok Rozkład próbkowania wariancji próbki jest rozkładem kwadratowym chi ze stopniem swobody równym , gdzie jest rozmiarem próbki (biorąc pod uwagę, że losowa zmienna będąca przedmiotem zainteresowania jest zwykle rozkładana).n - 1n-1n-1nnn Źródło Moja intuicja Ma to dla mnie intuicyjny sens 1), ponieważ test chi-kwadrat wygląda jak suma kwadratu i …

5
Próbkowanie dla niezrównoważonych danych w regresji
Pojawiły się dobre pytania dotyczące postępowania z niezrównoważonymi danymi w kontekście klasyfikacji , ale zastanawiam się, co ludzie robią, aby próbować pod kątem regresji. Powiedzmy, że dziedzina problemowa jest bardzo wrażliwa na znak, ale tylko w pewnym stopniu wrażliwa na wielkość celu. Jednak wielkość jest na tyle ważna, że ​​modelem …


1
Bootstrapping kontra Bayesian Bootstrapping koncepcyjnie?
Mam problem ze zrozumieniem, czym jest proces ładowania bayesowskiego i czym różni się on od normalnego ładowania początkowego. A gdyby ktoś mógł zaoferować intuicyjny / konceptualny przegląd i porównanie obu, byłoby świetnie. Weźmy przykład. Powiedzmy, że mamy zestaw danych X, który jest [1,2,5,7,3]. Jeśli próbujemy z zamianą wiele razy, aby …

1
Czy właśnie wymyśliłem bayesowską metodę analizy krzywych ROC?
Preambuła To jest długi post. Jeśli ponownie to czytasz, pamiętaj, że poprawiłem część pytania, chociaż materiał tła pozostaje taki sam. Dodatkowo uważam, że opracowałem rozwiązanie problemu. To rozwiązanie pojawia się na dole wpisu. Dzięki CliffAB za wskazanie, że moje oryginalne rozwiązanie (edytowane z tego postu; zobacz historię edycji tego rozwiązania) …

4
Jak rzutować nowy wektor na przestrzeń PCA?
Po przeprowadzeniu analizy głównego składnika (PCA) chcę rzutować nowy wektor na przestrzeń PCA (tzn. Znaleźć jego współrzędne w układzie współrzędnych PCA). Mam obliczony PCA w języku R użyciu prcomp. Teraz powinienem być w stanie pomnożyć mój wektor przez macierz obrotu PCA. Czy główne elementy tej macierzy powinny być ułożone w …
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.