Pytania otagowane jako proportion

Proporcja to ułamek pewnej sumy, która jest określonego rodzaju, albo (i) jako liczba rzeczy jednego rodzaju z całkowitej liczby, albo (ii) jako składnik zmiennej ciągłej.

3
Przykład: regresja LASSO z użyciem glmnet dla wyniku binarnego
Zaczynam bawić sięglmnet za pomocą regresji LASSO, gdzie moje wyniki zainteresowania są dychotomiczne. Poniżej utworzyłem małą próbną ramkę danych: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

2
Jaki jest związek między testem chi-kwadrat a testem o równych proporcjach?
Załóżmy, że mam trzy populacje o czterech wzajemnie wykluczających się cechach. Pobieram losowe próbki z każdej populacji i tworzę tabelę krzyżową lub tabelę częstotliwości dla cech, które mierzę. Czy mam rację mówiąc, że: Gdybym chciał sprawdzić, czy istnieje jakikolwiek związek między populacjami a cechami (np. Czy jedna populacja ma wyższą …

4
Dokładny dwumianowy test dwóch proporcji próbki w R (i niektóre dziwne wartości p)
Próbuję rozwiązać następujące pytanie: Gracz A wygrał 17 z 25 gier, podczas gdy gracz B wygrał 8 z 20 - czy istnieje znacząca różnica między obydwoma współczynnikami? Co przychodzi na myśl w R, to: > prop.test(c(17,8),c(25,20),correct=FALSE) 2-sample test for equality of proportions without continuity correction data: c(17, 8) out of …


3
Bezpieczne określanie wielkości próbki do testów A / B
Jestem inżynierem oprogramowania, który chce zbudować narzędzie do testowania A / B. Nie mam solidnych statystyk, ale przez ostatnie kilka dni sporo czytałem. Postępuję zgodnie z opisaną tutaj metodologią i streszczę odpowiednie punkty poniżej. Narzędzie pozwoli projektantom i ekspertom domeny skonfigurować witrynę internetową w celu podziału ruchu otrzymanego pod określonym …

4
Jakie są prawidłowe wartości precyzji i przywołania w przypadkach krawędzi?
Precyzja jest zdefiniowana jako: p = true positives / (true positives + false positives) Czy jest to prawidłowe, że, jak true positivesi false positivespodejście 0, precyzja zbliża 1? To samo pytanie do przypomnienia: r = true positives / (true positives + false negatives) Obecnie wdrażam test statystyczny, w którym muszę …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
Na jakim poziomie test
TŁO: Pomiń bezpiecznie - jest tutaj w celach informacyjnych i uzasadnia pytanie. Otwarcie tego artykułu brzmi: „Słynny test przygodności chi-kwadrat Karla Pearsona pochodzi z innej statystyki, zwanej statystyką z, opartej na rozkładzie normalnym. Najprostsze wersje mogą być matematycznie identyczne z równoważnymi testami z. Testy dają taki sam wynik we wszystkich …

5
Czy można użyć chi kwadrat do porównania proporcji?
Czytałem, że test chi-kwadrat jest przydatny, aby sprawdzić, czy próbka znacznie różni się od zestawu wartości oczekiwanych. Na przykład, oto tabela wyników ankiety dotyczącej ulubionych kolorów ludzi (n = 15 + 13 + 10 + 17 = 55 wszystkich respondentów): red,blue,green,yellow 15,13,10,17 Test chi-kwadrat może mi powiedzieć, czy ta próbka …

1
Interpretowanie proporcji, które sumują się jako jedna zmienna niezależna w regresji liniowej
Znam pojęcie zmiennych kategorialnych i odpowiednie kodowanie zmiennych zastępczych, które pozwalają nam dopasować jeden poziom jako poziom podstawowy, aby uniknąć kolinearności. Znam również sposób interpretacji oszacowań parametrów z takich modeli: Przewidywana zmiana wyniku dla danego dopasowanego poziomu predyktora jakościowego w stosunku do kategorii podstawowej. Nie jestem pewien, jak interpretować zestaw …




5
Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?
Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

1
Clopper-Pearson dla nie matematyków
Zastanawiałem się, czy ktokolwiek może wyjaśnić mi intuicję poza Clopper-Pearson CI dla proporcji. O ile mi wiadomo, każdy element CI zawiera wariancję. Jednak w przypadku proporcji, nawet jeśli moja proporcja wynosi 0 lub 1 (0% lub 100%), można obliczyć CI Cloppera-Pearsona. Próbowałem spojrzeć na formuły i rozumiem, że ma coś …

2
Test vs -test do porównywania szans na przeziębienie w 2 grupach
Właśnie przeczytałem w dość szanowanym (popularnym) magazynie naukowym (niemiecki premier, 02/2013, s. 36) o ciekawym eksperymencie (niestety bez źródła). Przyciągnęło to moją uwagę, ponieważ intuicyjnie wątpiłem w znaczenie wyniku, ale dostarczone informacje były wystarczające do odtworzenia testów statystycznych. Naukowcy zastanawiali się, czy przeziębienie w zimne dni zwiększa szanse na przeziębienie. …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.