Pytania otagowane jako distributions

Rozkład to matematyczny opis prawdopodobieństw lub częstotliwości.

1
Obliczanie powtarzalności efektów z modelu Lmer
Właśnie natknąłem się na ten artykuł , który opisuje, jak obliczyć powtarzalność (aka niezawodność, aka korelacja wewnątrzklasowa) pomiaru za pomocą modelowania efektów mieszanych. Kod R byłby następujący: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = attr(vc$id,'stddev')[1]^2 #compute the unadjusted repeatability …
28 mixed-model  reliability  intraclass-correlation  repeatability  spss  factor-analysis  survey  modeling  cross-validation  error  curve-fitting  mediation  correlation  clustering  sampling  machine-learning  probability  classification  metric  r  project-management  optimization  svm  python  dataset  quality-control  checking  clustering  distributions  anova  factor-analysis  exponential  poisson-distribution  generalized-linear-model  deviance  machine-learning  k-nearest-neighbour  r  hypothesis-testing  t-test  r  variance  levenes-test  bayesian  software  bayesian-network  regression  repeated-measures  least-squares  change-scores  variance  chi-squared  variance  nonlinear-regression  regression-coefficients  multiple-comparisons  p-value  r  statistical-significance  excel  sampling  sample  r  distributions  interpretation  goodness-of-fit  normality-assumption  probability  self-study  distributions  references  theory  time-series  clustering  econometrics  binomial  hypothesis-testing  variance  t-test  paired-comparisons  statistical-significance  ab-test  r  references  hypothesis-testing  t-test  normality-assumption  wilcoxon-mann-whitney  central-limit-theorem  t-test  data-visualization  interactive-visualization  goodness-of-fit 

7
Jak generować liczby na podstawie arbitralnej dystrybucji dyskretnej?
Jak generować liczby na podstawie dowolnego dyskretnego rozkładu? Na przykład mam zestaw liczb, które chcę wygenerować. Powiedzmy, że są oznaczone od 1-3 w następujący sposób. 1: 4%, 2: 50%, 3: 46% Zasadniczo odsetki to prawdopodobieństwa, że ​​pojawią się na wyjściu generatora liczb losowych. Mam generator liczb pesudorandom, który wygeneruje jednolity …


6
W kategoriach laika jaka jest różnica między modelem a dystrybucją?
Odpowiedzi (definicje) zdefiniowane na Wikipedii są prawdopodobnie nieco tajemnicze dla osób niezaznajomionych z wyższą matematyką / statystyką. W kategoriach matematycznych model statystyczny jest zwykle uważany za parę ( ), gdzie jest zbiorem możliwych obserwacji, tj. Przestrzenią próbki, a jest zbiorem rozkładów prawdopodobieństwa o . S P SS,PS,PS, \mathcal{P}SSSPP\mathcal{P}SSS W prawdopodobieństwie …

2
Dlaczego RSS jest dystrybuowany chi razy razy np?
Chciałbym zrozumieć, dlaczego w modelu OLS rozkłada się RSS (resztkową sumę kwadratów) χ2⋅(n−p)χ2⋅(n−p)\chi^2\cdot (n-p) ( ppp oznacza liczbę parametrów w modelu, nnn liczbę obserwacji). Przepraszam, że zadałem tak podstawowe pytanie, ale wydaje się, że nie jestem w stanie znaleźć odpowiedzi online (lub w moich, bardziej zorientowanych na aplikację podręcznikach).

1
Czy stopnie swobody mogą być liczbą niecałkowitą?
Kiedy korzystam z GAM, daje mi resztkowy DF (ostatni wiersz kodu). Co to znaczy? Wychodząc poza przykład GAM, ogólnie, czy liczba stopni swobody może być liczbą niecałkowitą?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median 3Q Max -4.1470 -1.6217 -0.8971 …
27 r  degrees-of-freedom  gam  machine-learning  pca  lasso  probability  self-study  bootstrap  expected-value  regression  machine-learning  linear-model  probability  simulation  random-generation  machine-learning  distributions  svm  libsvm  classification  pca  multivariate-analysis  feature-selection  archaeology  r  regression  dataset  simulation  r  regression  time-series  forecasting  predictive-models  r  mean  sem  lavaan  machine-learning  regularization  regression  conv-neural-network  convolution  classification  deep-learning  conv-neural-network  regression  categorical-data  econometrics  r  confirmatory-factor  scale-invariance  self-study  unbiased-estimator  mse  regression  residuals  sampling  random-variable  sample  probability  random-variable  convergence  r  survival  weibull  references  autocorrelation  hypothesis-testing  distributions  correlation  regression  statistical-significance  regression-coefficients  univariate  categorical-data  chi-squared  regression  machine-learning  multiple-regression  categorical-data  linear-model  pca  factor-analysis  factor-rotation  classification  scikit-learn  logistic  p-value  regression  panel-data  multilevel-analysis  variance  bootstrap  bias  probability  r  distributions  interquartile  time-series  hypothesis-testing  normal-distribution  normality-assumption  kurtosis  arima  panel-data  stata  clustered-standard-errors  machine-learning  optimization  lasso  multivariate-analysis  ancova  machine-learning  cross-validation 

2
Czym dokładnie jest alfa w rozkładzie Dirichleta?
Jestem całkiem nowy w statystyce bayesowskiej i natrafiłem na poprawioną miarę korelacji, SparCC , która wykorzystuje proces Dirichleta w backendie tego algorytmu. Próbowałem przejść przez algorytm krok po kroku, aby naprawdę zrozumieć, co się dzieje, ale nie jestem pewien, co dokładnie alpharobi parametr wektorowy w rozkładzie Dirichleta i jak normalizuje …

5
Intuicyjne wyjaśnienie zbieżności w rozkładzie i zbieżności w prawdopodobieństwie
Jaka jest intuicyjna różnica między zmienną losową zbieżną w prawdopodobieństwie a zmienną losową zbieżną w rozkładzie? Przeczytałem wiele definicji i równań matematycznych, ale to naprawdę nie pomaga. (Należy pamiętać, że jestem studentem licencjackim studiującym ekonometrię). W jaki sposób zmienna losowa może zbiegać się w jedną liczbę, ale także w rozkład?

7
Testowanie hipotez dystrybucyjnych - po co to robić, jeśli nie możesz „zaakceptować” swojej hipotezy zerowej?
Różne testy hipotez, takie jak test GOF , Kołmogorow-Smirnov, Anderson-Darling itp., Mają ten podstawowy format:χ2)χ2)\chi^{2} H.0H.0H_0 : Dane są zgodne z podanym rozkładem. H.1H.1H_1 : Dane nie są zgodne z podaną dystrybucją. Zazwyczaj ocenia się twierdzenie, że niektóre dane są zgodne z pewnym rozkładem, a jeśli odrzuca się , dane …

2
Czy dystrybucja ma nazwę?
Pewnego dnia natknąłem się na tę gęstość. Czy ktoś nadał temu imię? fa( x ) = log( 1 + x- 2) / 2 πfa(x)=log⁡(1+x-2))/2)πf(x) = \log(1 + x^{-2}) / 2\pi Gęstość jest nieskończona u źródła, a także ma grube ogony. Widziałem go jako wcześniejszy rozkład w kontekście, w którym spodziewano …



6
Jakie są dobre techniki wizualizacji danych do porównywania dystrybucji?
Piszę pracę doktorską i zdałem sobie sprawę, że nadmiernie polegam na wykresach pudełkowych w celu porównania rozkładów. Jakie inne alternatywy podoba Ci się w realizacji tego zadania? Chciałbym również zapytać, czy znasz inne zasoby, takie jak galeria R, w której mogę zainspirować się różnymi pomysłami na wizualizację danych.

3
Dlaczego działa test Kołmogorowa-Smirnowa?
Czytając o 2-próbnym teście KS, rozumiem dokładnie, co on robi, ale nie rozumiem, dlaczego to działa . Innymi słowy, mogę wykonać wszystkie kroki, aby obliczyć funkcje rozkładu empirycznego, znaleźć maksymalną różnicę między nimi, aby znaleźć statystykę D, obliczyć wartości krytyczne, przekonwertować statystykę D na wartość p itp. Ale nie mam …


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.