Pytania otagowane jako definition

Ten znacznik wskazuje pytania dotyczące definicji terminów statystycznych. Użyj bardziej ogólnego znacznika [terminologia] w przypadku pytań dotyczących języka statystycznego, które nie dotyczą konkretnie definicji.

3
Czym dokładnie jest dystrybucja?
Bardzo mało wiem na temat prawdopodobieństwa i statystyki i chcę się uczyć. Widzę słowo „dystrybucja” używane wszędzie w różnych kontekstach. Na przykład dyskretna zmienna losowa ma „rozkład prawdopodobieństwa”. Wiem co to jest. Ciągła zmienna losowa ma funkcję gęstości prawdopodobieństwa, a zatem dla x∈Rx∈Rx\in\mathbb{R} całka od −∞−∞-\infty do xxx funkcji gęstości …

4
Dokładność maszyny zwiększającej gradient zmniejsza się wraz ze wzrostem liczby iteracji
Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 


1
Jaka jest dokładna definicja „przypadku Heywooda”?
Użyłem terminu „przypadek Heywooda” w sposób nieco nieformalny, aby odnieść się do sytuacji, w których online, „skończona odpowiedź” iteracyjnie zaktualizowana ocena wariancji stała się negatywna z powodu problemów z precyzją liczbową. (Korzystam z wariantu metody Welforda, aby dodawać dane i usuwać starsze dane). Miałem wrażenie, że odnosi się to do …


1
W jaki sposób „podstawowe twierdzenie analizy czynnikowej” stosuje się do PCA lub jak definiuje się ładunki PCA?
Obecnie przeglądam zestaw slajdów, który mam do „analizy czynnikowej” (o ile wiem, PCA). Wywodzi się w nim „podstawowe twierdzenie analizy czynnikowej”, które twierdzi, że macierz korelacji danych przechodzących do analizy ( ) można odzyskać za pomocą macierzy ładunków czynnikowych ( ):RR\bf RAA\bf A R=AA⊤R=AA⊤\bf R = AA^\top To mnie jednak …

1
Confounder - definicja
Według M. Katza w jego książce Analiza wieloczynnikowa (sekcja 1.2, strona 6): „ Zdezorientator jest związany z czynnikiem ryzyka i przyczynowo związany z wynikiem. ” Dlaczego ten dezorientator musi być przyczynowo związany z wynikiem? Czy wystarczyłoby, aby osoba wprowadzająca zamieszanie kojarzyła się z wynikiem?

2
Czy odrzucasz hipotezę zerową, gdy
Jest to oczywiście kwestia definicji lub konwencji i praktycznie nie ma praktycznego znaczenia. Jeśli jest ustawiona na tradycyjną wartość 0,05, to czy wartość 0,0500000000000 ... jest uważana za statystycznie znaczącą, czy nie? Czy reguła definiująca istotność statystyczną jest zwykle uważana za lub ??p p &lt; α p ≤ ααα\alphapppp&lt;αp&lt;αp < …

6
Jaka jest różnica między skutecznością a skutecznością w określaniu korzyści terapii „A” pod warunkiem „B”?
Kontekst tego pytania mieści się w ramach zdrowia, tj. Patrząc na jedną lub więcej terapii w leczeniu stanu. Wygląda na to, że nawet szanowani badacze mylą pojęcia skuteczność i skuteczność , używając tych zamiennie. Jak można myśleć o skuteczności w porównaniu ze skutecznością w sposób, który pomoże usunąć zamieszanie? Jakiego …

2
znaczenie (x) operatora?
Wszędzie widziałem operatora w jakimś przeglądzie literatury na temat przyczynowości (patrz, na przykład, ten wpis na Wikipedii ). Nie mogę jednak znaleźć formalnej i ogólnej definicji tego operatora.do(x)do(x)do(x) Czy ktoś może wskazać mi dobre odniesienie w tej sprawie? Interesuje mnie ogólna definicja, a nie jej interpretacja w konkretnym eksperymencie.



3
Definicja i delimitacja modelu regresji
Żenująco proste pytanie - ale wydaje się, że nie zostało wcześniej zadane w Cross Validated: Jaka jest definicja modelu regresji? Także pytanie pomocnicze, Co to nie jest model regresji? Jeśli chodzi o to drugie, interesują mnie trudne przykłady, w których odpowiedź nie jest od razu oczywista, np. ARIMA lub GARCH.

2
Co to są prawidłowości i regularyzacja?
Coraz częściej słyszę te słowa, ucząc się uczenia maszynowego. W rzeczywistości niektórzy ludzie zdobyli medal Fieldsa, pracując nad prawidłowością równań. Sądzę więc, że jest to termin, który przenosi się z fizyki statystycznej / matematyki na uczenie maszynowe. Oczywiście wiele osób, o które pytałem, nie mogło tego intuicyjnie wyjaśnić. Wiem, że …

5
Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?
Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat &lt;- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) &lt;- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.