Statystyki i duże zbiory danych definition

3

Bardzo mało wiem na temat prawdopodobieństwa i statystyki i chcę się uczyć. Widzę słowo „dystrybucja” używane wszędzie w różnych kontekstach. Na przykład dyskretna zmienna losowa ma „rozkład prawdopodobieństwa”. Wiem co to jest. Ciągła zmienna losowa ma funkcję gęstości prawdopodobieństwa, a zatem dla x∈Rx∈Rx\in\mathbb{R} całka od −∞−∞-\infty do xxx funkcji gęstości …

16 distributions definition

4

Dokładność maszyny zwiększającej gradient zmniejsza się wraz ze wzrostem liczby iteracji

Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …

15 machine-learning caret boosting gbm hypothesis-testing t-test panel-data psychometrics intraclass-correlation generalized-linear-model categorical-data binomial model intercept causality cross-correlation distributions ranks p-value z-test sign-test time-series references terminology cross-correlation definition probability distributions beta-distribution inverse-gamma missing-data paired-comparisons paired-data clustered-standard-errors cluster-sample time-series arima logistic binary-data odds-ratio medicine hypothesis-testing wilcoxon-mann-whitney unsupervised-learning hierarchical-clustering neural-networks train clustering k-means regression ordinal-data change-scores machine-learning experiment-design roc precision-recall auc stata multilevel-analysis regression fitting nonlinear jmp r data-visualization gam gamm4 r lme4-nlme many-categories regression causality instrumental-variables endogeneity controlling-for-a-variable

5

Różnica między terminami „wspólna dystrybucja” i „dystrybucja wielowymiarowa”?

Piszę o zastosowaniu „wspólnego rozkładu prawdopodobieństwa” dla odbiorców, którzy byliby bardziej skłonni zrozumieć „rozkład wielu zmiennych”, dlatego rozważam użycie późniejszego. Jednak nie chcę przy tym tracić sensu. Wikipedia zdaje się wskazywać, że są to synonimy. Czy oni są? Jeśli nie, dlaczego nie?

15 probability terminology joint-distribution definition

1

Jaka jest dokładna definicja „przypadku Heywooda”?

Użyłem terminu „przypadek Heywooda” w sposób nieco nieformalny, aby odnieść się do sytuacji, w których online, „skończona odpowiedź” iteracyjnie zaktualizowana ocena wariancji stała się negatywna z powodu problemów z precyzją liczbową. (Korzystam z wariantu metody Welforda, aby dodawać dane i usuwać starsze dane). Miałem wrażenie, że odnosi się to do …

15 variance factor-analysis definition online

2

Przykłady statystyki, która nie jest niezależna od rozkładu próbki?

To jest definicja statystyki na wikipedii Bardziej formalnie, teoria statystyczna definiuje statystykę jako funkcję próbki, w której sama funkcja jest niezależna od rozkładu próbki; to znaczy funkcję można określić przed realizacją danych. Pojęcie statystyki jest używane zarówno dla funkcji, jak i dla wartości funkcji dla danej próbki. Myślę, że rozumiem …

14 mathematical-statistics definition

1

W jaki sposób „podstawowe twierdzenie analizy czynnikowej” stosuje się do PCA lub jak definiuje się ładunki PCA?

Obecnie przeglądam zestaw slajdów, który mam do „analizy czynnikowej” (o ile wiem, PCA). Wywodzi się w nim „podstawowe twierdzenie analizy czynnikowej”, które twierdzi, że macierz korelacji danych przechodzących do analizy ( ) można odzyskać za pomocą macierzy ładunków czynnikowych ( ):RR\bf RAA\bf A R=AA⊤R=AA⊤\bf R = AA^\top To mnie jednak …

14 pca factor-analysis terminology definition

1

Confounder - definicja

Według M. Katza w jego książce Analiza wieloczynnikowa (sekcja 1.2, strona 6): „ Zdezorientator jest związany z czynnikiem ryzyka i przyczynowo związany z wynikiem. ” Dlaczego ten dezorientator musi być przyczynowo związany z wynikiem? Czy wystarczyłoby, aby osoba wprowadzająca zamieszanie kojarzyła się z wynikiem?

14 causality definition confounding

2

Czy odrzucasz hipotezę zerową, gdy

Jest to oczywiście kwestia definicji lub konwencji i praktycznie nie ma praktycznego znaczenia. Jeśli jest ustawiona na tradycyjną wartość 0,05, to czy wartość 0,0500000000000 ... jest uważana za statystycznie znaczącą, czy nie? Czy reguła definiująca istotność statystyczną jest zwykle uważana za lub ??p p < α p ≤ ααα\alphapppp<αp<αp < …

14 hypothesis-testing statistical-significance definition

6

Jaka jest różnica między skutecznością a skutecznością w określaniu korzyści terapii „A” pod warunkiem „B”?

Kontekst tego pytania mieści się w ramach zdrowia, tj. Patrząc na jedną lub więcej terapii w leczeniu stanu. Wygląda na to, że nawet szanowani badacze mylą pojęcia skuteczność i skuteczność , używając tych zamiennie. Jak można myśleć o skuteczności w porównaniu ze skutecznością w sposób, który pomoże usunąć zamieszanie? Jakiego …

14 epidemiology causality clinical-trials definition instrumental-variables

2

znaczenie (x) operatora?

Wszędzie widziałem operatora w jakimś przeglądzie literatury na temat przyczynowości (patrz, na przykład, ten wpis na Wikipedii ). Nie mogę jednak znaleźć formalnej i ogólnej definicji tego operatora.do(x)do(x)do(x) Czy ktoś może wskazać mi dobre odniesienie w tej sprawie? Interesuje mnie ogólna definicja, a nie jej interpretacja w konkretnym eksperymencie.

14 references causality definition

2

Co to jest próbkowanie Thompsona w kategoriach laika?

Nie jestem w stanie zrozumieć, jak działa Thompson Sampling . Czytałem o Multi Arm Bandit i po przeczytaniu algorytmu Upper Confidence Bound Algorytm wiele tekstów sugerowało, że próbkowanie Thompsona działa lepiej niż UCB. Co to jest próbkowanie Thompsona, w laika lub po prostu? Zapraszam do dostarczenia artykułów referencyjnych w celu …

14 machine-learning definition multiarmed-bandit

2

Co oznacza „niezmiennik permutacyjny” w kontekście sieci neuronowych rozpoznających obrazy?

Widziałem termin „niezmiennicza permutacja” wersja zadania rozpoznawania cyfr MNIST. Co to znaczy?

14 machine-learning neural-networks terminology conv-neural-network definition

3

Definicja i delimitacja modelu regresji

Żenująco proste pytanie - ale wydaje się, że nie zostało wcześniej zadane w Cross Validated: Jaka jest definicja modelu regresji? Także pytanie pomocnicze, Co to nie jest model regresji? Jeśli chodzi o to drugie, interesują mnie trudne przykłady, w których odpowiedź nie jest od razu oczywista, np. ARIMA lub GARCH.

13 regression linear-model model terminology definition

2

Co to są prawidłowości i regularyzacja?

Coraz częściej słyszę te słowa, ucząc się uczenia maszynowego. W rzeczywistości niektórzy ludzie zdobyli medal Fieldsa, pracując nad prawidłowością równań. Sądzę więc, że jest to termin, który przenosi się z fizyki statystycznej / matematyki na uczenie maszynowe. Oczywiście wiele osób, o które pytałem, nie mogło tego intuicyjnie wyjaśnić. Wiem, że …

12 machine-learning self-study terminology regularization definition

5

Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?

Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …

12 r random-forest missing-data data-imputation multiple-imputation large-data definition moving-window self-study categorical-data econometrics standard-error regression-coefficients normal-distribution pdf lognormal regression python scikit-learn interpolation r self-study poisson-distribution chi-squared matlab matrix r modeling multinomial mlogit choice monte-carlo indicator-function r aic garch likelihood r regression repeated-measures simulation multilevel-analysis chi-squared expected-value multinomial yates-correction classification regression self-study repeated-measures references residuals confidence-interval bootstrap normality-assumption resampling entropy cauchy clustering k-means r clustering categorical-data continuous-data r hypothesis-testing nonparametric probability bayesian pdf distributions exponential repeated-measures random-effects-model non-independent regression error regression-to-the-mean correlation group-differences post-hoc neural-networks r time-series t-test p-value normalization probability moments mgf time-series model seasonality r anova generalized-linear-model proportion percentage nonparametric ranks weighted-regression variogram classification neural-networks fuzzy variance dimensionality-reduction confidence-interval proportion z-test r self-study pdf

Pytania otagowane jako definition