Pytania otagowane jako normal-distribution

Rozkład normalny lub Gaussa ma funkcję gęstości, która jest symetryczną krzywą w kształcie dzwonu. Jest to jeden z najważniejszych rozkładów w statystykach. Użyj tagu [normalność], aby zapytać o testowanie normalności.

5
Jak wykonać przypisanie wartości w bardzo dużej liczbie punktów danych?
Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

4
Założenia dotyczące regresji resztkowej regresji
Dlaczego konieczne jest założenie podziału na błędy, tj yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , z ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) . Dlaczego nie napisać? yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , z yi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) , gdzie w obu przypadkach ϵi=yi−y^ϵi=yi−y^\epsilon_i = y_i - \hat{y} . Podkreśliłem, że założenia dystrybucyjne dotyczą błędów, a …

1
Dlaczego test F w Gaussowskich modelach liniowych jest najbardziej wydajny?
W przypadku Gaussowskiego modelu liniowego gdzie zakłada się, że leży w pewnej przestrzeni wektorowej a ma standardowy rozkład normalny na , statystyka testu dla , gdzie jest przestrzeń wektorową, to zwiększa się do jedną z funkcji odchyleń statystyki: Skąd możemy wiedzieć, że ta statystyka zapewnia najsilniejszy test dla H_0Y=μ+σGY=μ+σGY=\mu+\sigma Gμμ\muWWWGGGRnRn\mathbb{R}^nFFFH0:{μ∈U}H0:{μ∈U}H_0\colon\{\mu …

3
Jak przekształcić rozkład lepeptyczny w normalność?
Załóżmy, że mam zmienną leptokurtyczną, którą chciałbym przekształcić do normalności. Jakie transformacje mogą wykonać to zadanie? Doskonale zdaję sobie sprawę z tego, że przekształcanie danych nie zawsze może być pożądane, ale dla celów akademickich załóżmy, że chcę „wbić” dane w normalność. Ponadto, jak można zauważyć na podstawie wykresu, wszystkie wartości …

2
Intuicja za funkcją gęstości rozkładów T.
Studiuję o rozkładzie t-Studenta i zacząłem się zastanawiać, jak można wyprowadzić funkcję gęstości rozkładów t (z wikipedii, http://en.wikipedia.org/wiki/Student%27s_t-distribution ): fa( t ) = Γ ( v + 12))v π--√Γ ( w2))( 1 + t2)v)- v + 12)f(t)=Γ(v+12)vπΓ(v2)(1+t2v)−v+12f(t) = \frac{\Gamma(\frac{v+1}{2})}{\sqrt{v\pi}\:\Gamma(\frac{v}{2})}\left(1+\frac{t^2}{v} \right)^{-\frac{v+1}{2}} gdzie to stopnie swobody, a to funkcja gamma. Jaka jest …

2
Kiedy dane mają rozkład gaussowski, ile próbek je scharakteryzuje?
Dane gaussowskie rozmieszczone w jednym wymiarze wymagają dwóch parametrów do jego scharakteryzowania (średnia, wariancja), a plotka głosi, że około 30 losowo wybranych próbek jest zwykle wystarczających do oszacowania tych parametrów z dość dużą pewnością. Ale co się stanie, gdy liczba wymiarów wzrośnie? W dwóch wymiarach (np. Wysokość, waga) potrzeba 5 …


2
Jaka jest odległość między skończoną mieszanką gaussowską a gaussowską?
Załóżmy, że mam mieszankę skończonej liczby Gaussów ze znanymi wagami, średnimi i standardowymi odchyleniami. Średnie nie są równe. Oczywiście można obliczyć średnią i odchylenie standardowe mieszaniny, ponieważ momenty są ważonymi średnimi momentów składników. Mieszanina nie ma rozkładu normalnego, ale jak daleko jest od normalności? Powyższy obraz pokazuje gęstości prawdopodobieństwa dla …


1
Pakiety Python do pracy z modelami mieszanin Gaussa (GMM)
Wydaje się, że istnieje kilka opcji pracy z modelami mieszanki Gaussa (GMM) w Pythonie. Na pierwszy rzut oka są co najmniej: PyMix - http://www.pymix.org/pymix/index.php Narzędzia do modelowania mieszanin PyEM - http://www.ar.media.kyoto-u.ac.jp/members/david/softwares/em/, który jest częścią zestawu narzędzi Scipy i wydaje się koncentrować na aktualizacji GMM : Teraz znany jako sklearn.mixture . …




3
Jeffreys Prior dla rozkładu normalnego z nieznaną średnią i wariancją
Czytam wcześniejsze rozkłady i wcześniej obliczyłem Jeffreysa dla próbki normalnie rozmieszczonych zmiennych losowych o nieznanej średniej i nieznanej wariancji. Zgodnie z moimi obliczeniami, dla Jeffreysa przedtem obowiązuje: Tutaj matrycą informacji Fishera.jap ( μ , σ2)) = de t ( I)-----√= de t ( 1 / σ2)001 / ( 2 σ4))------------------√= …

2
Rozkład prawdopodobieństwa dla hałaśliwej fali sinusoidalnej
Chcę analitycznie obliczyć rozkład prawdopodobieństwa punktów próbkowania z funkcji oscylacyjnej, gdy wystąpi jakiś błąd pomiaru. Obliczyłem już rozkład prawdopodobieństwa dla części „bez szumu” (umieszczę to na końcu), ale nie mogę wymyślić, jak uwzględnić „szum”. Szacunek liczbowy Aby być bardziej zrozumiałym, wyobraź sobie, że istnieje funkcja której losowo wybierasz punkty podczas …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.