Pytania otagowane jako stratification

Technika pobierania próbek, w której populację będącą przedmiotem zainteresowania dzieli się na podzbiory („warstwy”) na podstawie cech znanych wszystkich jednostek przed pobraniem próbek.

3
Zrozumienie stratyfikacji krzyżowej
Jaka jest różnica między walidacją krzyżową a walidacją krzyżową ? Wikipedia mówi: W warstwowej walidacji krzyżowej k-krotnie fałdy są wybierane tak, aby średnia wartość odpowiedzi była w przybliżeniu równa we wszystkich fałdach. W przypadku klasyfikacji dychotomicznej oznacza to, że każda fałda zawiera w przybliżeniu te same proporcje dwóch rodzajów etykiet …

2
Dlaczego warto stosować stratyfikację krzyżową? Dlaczego nie wpływa to na korzyści związane z wariancją?
Powiedziano mi, że korzystne jest stosowanie warstwowej weryfikacji krzyżowej, zwłaszcza gdy klasy odpowiedzi są niezrównoważone. Jeśli jednym z celów walidacji krzyżowej jest pomoc w rozliczeniu losowości naszej oryginalnej próbki danych treningowych, na pewno sprawienie, by każda zakładka miała taki sam rozkład klas, działałoby przeciwko temu, chyba że byłeś pewien, że …

1
Korzyści z próbkowania warstwowego vs losowego do generowania danych treningowych w klasyfikacji
Chciałbym wiedzieć, czy są jakieś / jakieś zalety stosowania próbkowania warstwowego zamiast próbkowania losowego, podczas dzielenia oryginalnego zestawu danych na zestaw szkoleniowy i testowy do klasyfikacji. Ponadto, czy próbkowanie warstwowe wprowadza więcej uprzedzeń do klasyfikatora niż próbkowanie losowe? Aplikacja, dla której chciałbym zastosować próbkowanie warstwowe do przygotowania danych, jest klasyfikatorem …

1
Czy dopasowanie modelu Coxa do interakcji między warstwami i zmiennymi kowariancyjnymi różni się od dopasowania dwóch modeli Coxa?
W Strategii modelowania regresji autorstwa Harrella (druga edycja) znajduje się sekcja (S. 20.1.7) omawiająca modele Coxa, w tym interakcję między zmienną towarzyszącą, której główny wpływ na przeżycie chcemy również oszacować (wiek w przykładzie poniżej) i zmienna towarzysząca, której głównego efektu nie chcemy oszacować (płeć w poniższym przykładzie). Konkretnie: załóżmy, że …

2
Alternatywa rozkładu empirycznego
HOJNOŚĆ: Pełne nagroda zostanie przyznana osobie, która stanowi odniesienie do wszelkich opublikowanych papieru, który używa lub wymienia prognozy F~F~\tilde{F} poniżej. Motywacja: Ta sekcja prawdopodobnie nie jest dla ciebie ważna i podejrzewam, że nie pomoże ci zdobyć nagrody, ale ponieważ ktoś zapytał o motywację, oto nad czym pracuję. Pracuję nad problemem …


2
Pobieranie próbek z zamianą w R randomForest
Implementacja randomForest nie pozwala na pobieranie próbek poza liczbę obserwacji, nawet w przypadku pobierania próbek z wymianą. Dlaczego to? Działa w porządku: rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE) rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE) Co chcę robić: rf <- randomForest(Species ~ ., iris, sampsize=c(51, …

3
Model wielopoziomowy a osobne modele dla każdego poziomu
Jakie są zalety i wady uruchamiania osobnych modeli w porównaniu z modelowaniem wielopoziomowym? W szczególności załóżmy, że w badaniu przebadano pacjentów zagnieżdżonych w gabinetach lekarskich zagnieżdżonych w poszczególnych krajach. Jakie są zalety / wady prowadzenia osobnych modeli dla każdego kraju w porównaniu z trójpoziomowym modelem zagnieżdżonym?

1
Dlaczego Anova () i drop1 () podają różne odpowiedzi dla GLMM?
Mam GLMM w postaci: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Kiedy używam drop1(model, test="Chi"), otrzymuję inne wyniki niż w przypadku korzystania Anova(model, type="III")z pakietu samochodowego lub summary(model). Te dwa ostatnie dają te same odpowiedzi. Korzystając z wielu sfabrykowanych danych, odkryłem, że te …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.