Pytania otagowane jako variance

Oczekiwane kwadratowe odchylenie zmiennej losowej od jej średniej; lub średnie kwadratowe odchylenie danych o ich średniej.


3
Twierdzenie o granicy centralnej i rozkład Pareto
Czy ktoś może przedstawić proste (świeckie) wyjaśnienie związku między rozkładami Pareto a centralnym twierdzeniem granicznym (np. Czy ma zastosowanie? Dlaczego / dlaczego nie?)? Próbuję zrozumieć następujące oświadczenie: „Twierdzenie o granicy centralnej nie działa z każdym rozkładem. Wynika to z jednego podstępnego faktu - średnie próbki są skupione wokół średniej rozkładu …

1
Wykorzystanie mediany do obliczania wariancji
Mam losową zmienną 1-D, która jest niezwykle wypaczona. Aby znormalizować ten rozkład, chcę raczej użyć mediany niż średniej. moje pytanie brzmi: czy mogę obliczyć wariancję rozkładu przy użyciu mediany we wzorze zamiast średniej? tzn. czy mogę wymienić V a r (X) = ∑ [ (Xja- m e a n ( …
10 variance  mean  median 

4
Model historii zdarzeń dyskretnych (przeżycie) w R.
Próbuję dopasować model czasu dyskretnego do R, ale nie jestem pewien, jak to zrobić. Czytałem, że możesz zorganizować zmienną zależną w różnych wierszach, po jednym dla każdej obserwacji czasu, i użyć glmfunkcji z łączem logit lub cloglog. W tym sensie, mam trzy kolumny: ID, Event(1 lub 0, w każdym okresie …
10 r  survival  pca  sas  matlab  neural-networks  r  logistic  spatial  spatial-interaction-model  r  time-series  econometrics  var  statistical-significance  t-test  cross-validation  sample-size  r  regression  optimization  least-squares  constrained-regression  nonparametric  ordinal-data  wilcoxon-signed-rank  references  neural-networks  jags  bugs  hierarchical-bayesian  gaussian-mixture  r  regression  svm  predictive-models  libsvm  scikit-learn  probability  self-study  stata  sample-size  spss  wilcoxon-mann-whitney  survey  ordinal-data  likert  group-differences  r  regression  anova  mathematical-statistics  normal-distribution  random-generation  truncation  repeated-measures  variance  variability  distributions  random-generation  uniform  regression  r  generalized-linear-model  goodness-of-fit  data-visualization  r  time-series  arima  autoregressive  confidence-interval  r  time-series  arima  autocorrelation  seasonality  hypothesis-testing  bayesian  frequentist  uninformative-prior  correlation  matlab  cross-correlation 

1
Co to jest wariancja punktowa?
Czytając „Elementy uczenia statystycznego ” kilkakrotnie spotkałem się z terminem „wariancja punktowa”. Chociaż mam niejasne pojęcie o tym, co to prawdopodobnie oznacza, byłbym wdzięczny za to Jak to jest zdefiniowane? Jak powstaje?
10 variance 

4
Wariancja rezystorów równolegle
Załóżmy, że masz zestaw rezystorów R, z których wszystkie są rozmieszczone ze średnią μ i wariancją σ. Rozważ odcinek obwodu o następującym układzie: (r) || (r + r) || (r + r + r). Równoważny opór każdej części to r, 2r i 3r. Wariancja każdej sekcji wynosiłaby wtedy σ2σ2σ^2 , …

1
R regresja liniowa zmienna kategorialna „ukryta” wartość
To tylko przykład, na który natknąłem się kilka razy, więc nie mam żadnych przykładowych danych. Uruchamianie modelu regresji liniowej w R: a.lm = lm(Y ~ x1 + x2) x1jest zmienną ciągłą. x2jest kategoryczny i ma trzy wartości, np. „Niska”, „Średnia” i „Wysoka”. Jednak dane wyjściowe podane przez R byłyby mniej …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

1
Dla jakiego problemu lub gry optymalne są wariancja i odchylenie standardowe?
Dla danej zmiennej losowej (lub populacji, lub procesu stochastycznego) oczekiwanie matematyczne jest odpowiedzią na pytanie: Która prognoza punktowa minimalizuje oczekiwaną stratę kwadratową? . Jest to również optymalne rozwiązanie dla gry. Zgadnij, kiedy zrealizujesz losową zmienną (lub nowe losowanie z populacji), a ja ukarzę cię kwadratową odległością między wartością a twoim …

2
Rozkład wariancji odchylenia: termin oczekiwanego kwadratu błędu prognozy mniej błędu nieredukowalnego
Hastie i in. „Elementy uczenia statystycznego” (2009) rozważają proces generowania danych z i .Y= f( X) + εY=f(X)+ε Y = f(X) + \varepsilon E (ε)=0E(ε)=0\mathbb{E}(\varepsilon)=0Var ( ε ) =σ2)εVar(ε)=σε2\text{Var}(\varepsilon)=\sigma^2_{\varepsilon} Prezentują następujący rozkład wariancji odchyłki oczekiwanego błędu kwadratu prognozy w punkcie (s. 223, wzór 7.9): W moim praca własna Nie określam …

3
Obracaj komponenty PCA, aby wyrównać wariancję w każdym komponencie
Staram się zmniejszyć wymiarowość i hałas zestawu danych, wykonując PCA na zbiorze danych i wyrzucając kilka ostatnich komputerów. Następnie chcę użyć niektórych algorytmów uczenia maszynowego na pozostałych komputerach, dlatego chcę znormalizować dane, wyrównując wariancję komputerów, aby algorytmy działały lepiej. Jednym prostym sposobem jest po prostu znormalizowanie wariancji wartości jednostkowych. Jednak …


2
Wariancja średniej próbki próbki ładowania początkowego
Niech będą odrębnymi obserwacjami (bez powiązań). Niech oznacza próbkę bootstrap (próbka z empirycznego CDF) i niech . Znajdź i .X1,...,XnX1,...,XnX_{1},...,X_{n}X∗1,...,X∗nX1∗,...,Xn∗X_{1}^{*},...,X_{n}^{*}X¯∗n=1n∑ni=1X∗iX¯n∗=1n∑i=1nXi∗\bar{X}_{n}^{*}=\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*}E(X¯∗n)E(X¯n∗)E(\bar{X}_{n}^{*})Var(X¯∗n)Var(X¯n∗)\mathrm{Var}(\bar{X}_{n}^{*}) Do tej pory mam to, że to każdy z prawdopodobieństwem więc i co daje X∗iXi∗X_{i}^{*}X1,...,XnX1,...,XnX_{1},...,X_{n}1n1n\frac{1}{n}E(X∗i)=1nE(X1)+...+1nE(Xn)=nμn=μE(Xi∗)=1nE(X1)+...+1nE(Xn)=nμn=μ E(X_{i}^{*})=\frac{1}{n}E(X_{1})+...+\frac{1}{n}E(X_{n})=\frac{n\mu}{n}=\mu E(X∗2i)=1nE(X21)+...+1nE(X2n)=n(μ2+σ2)n=μ2+σ2,E(Xi∗2)=1nE(X12)+...+1nE(Xn2)=n(μ2+σ2)n=μ2+σ2,E(X_{i}^{*2})=\frac{1}{n}E(X_{1}^{2})+...+\frac{1}{n}E(X_{n}^{2})=\frac{n(\mu^{2}+\sigma^{2})}{n}=\mu^{2}+\sigma^{2}\>, Var(X∗i)=E(X∗2i)−(E(X∗i))2=μ2+σ2−μ2=σ2.Var(Xi∗)=E(Xi∗2)−(E(Xi∗))2=μ2+σ2−μ2=σ2. \mathrm{Var}(X_{i}^{*})=E(X_{i}^{*2})-(E(X_{i}^{*}))^{2}=\mu^{2}+\sigma^{2}-\mu^{2}=\sigma^{2} \>. Następnie and od ' są niezależne. To dajeE(X¯∗n)=E(1n∑i=1nX∗i)=1n∑i=1nE(X∗i)=nμn=μE(X¯n∗)=E(1n∑i=1nXi∗)=1n∑i=1nE(Xi∗)=nμn=μE(\bar{X}_{n}^{*})=E(\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*})=\frac{1}{n}\sum_{i=1}^{n}E(X_{i}^{*})=\frac{n\mu}{n}=\mu Var(X¯∗n)=Var(1n∑i=1nX∗i)=1n2∑i=1nVar(X∗i)Var(X¯n∗)=Var(1n∑i=1nXi∗)=1n2∑i=1nVar(Xi∗) \mathrm{Var}(\bar{X}_{n}^{*})=\mathrm{Var}(\frac{1}{n}\sum_{i=1}^{n}X_{i}^{*})=\frac{1}{n^{2}}\sum_{i=1}^{n}\mathrm{Var}(X_{i}^{*})X∗iXi∗X_{i}^{*}Var(X¯∗n)=nσ2n2=σ2nVar(X¯n∗)=nσ2n2=σ2n\mathrm{Var}(\bar{X}_{n}^{*})=\frac{n\sigma^{2}}{n^{2}}=\frac{\sigma^{2}}{n} …

2
Znalezienie wariancji estymatora dla maksymalnego prawdopodobieństwa rozkładu Poissona
Jeśli są identyczne z rozkładami Poissona z parametrem Wypracowałem, że maksymalne oszacowanie prawdopodobieństwa to dla danych . Dlatego możemy zdefiniować odpowiedni estymator Moje pytanie brzmi: jak opracowałbyś wariancję tego estymatora?K1,…,KnK1,…,KnK_1, \dots, K_nββ\betaβ^(k1,…,kn)=1n∑i=1nkiβ^(k1,…,kn)=1n∑i=1nki\hat\beta (k_1, \dots, k_n) = \frac{1}{n} \sum_{i=1}^n k_ik1,…,knk1,…,knk_1, \dots, k_nT=1n∑i=1nKi.T=1n∑i=1nKi.T = \frac{1}{n} \sum_{i=1}^n K_i . W szczególności, ponieważ każdy …

2
Hipoteza zerowa Manna-Whitneya przy nierównej wariancji
Jestem tylko ciekawy hipotezy zerowej testu U Manna-Whitneya. Często widzę, że stwierdzono, iż hipoteza zerowa mówi, że dwie populacje mają równe rozkłady. Ale myślę - gdybym miał dwie normalne populacje o tej samej średniej, ale niezwykle nierównej wariancji, test Manna-Whitneya prawdopodobnie nie wykryłby tej różnicy. Widziałem także, że stwierdzono, iż …

4
Box Cox Transforms do regresji
Próbuję dopasować model liniowy do niektórych danych za pomocą tylko jednego predyktora (powiedzmy (x, y)). Dane są takie, że dla małych wartości x wartości y ściśle dopasowują się do linii prostej, jednak wraz ze wzrostem wartości x wartości y stają się bardziej zmienne. Oto przykład takich danych (kod R) y …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.