Statystyki i duże zbiory danych hypothesis-testing

3

Wybór testu statystycznego na podstawie wyniku innego (np. Normalności)

Słyszałem więc, że powiedziano, że wybór jednego testu statystycznego na podstawie wyniku innego nie jest dobrym pomysłem. Wydaje mi się to jednak dziwne. Na przykład ludzie często wybierają test nieparametryczny, gdy niektóre inne testy sugerują, że reszty nie są normalnie rozłożone. To podejście wydaje się dość powszechnie akceptowane, ale nie …

13 hypothesis-testing

3

Jak sprawdzić jednorodność w kilku wymiarach?

Testowanie jednorodności jest czymś powszechnym, ale zastanawiam się, jakie są metody, aby to zrobić dla wielowymiarowej chmury punktów.

13 hypothesis-testing uniform

3

Różnica między testami jednostronnymi a dwustronnymi?

Studiując kurs statystyki, starałem się zrozumieć różnicę między testami hipotez jedno- i dwustronnych. W szczególności dlaczego test jednostronny odrzuca wartość zerową, podczas gdy test dwustronny nie? Przykład:

13 hypothesis-testing

2

Jak sprawdzić, czy próbka danych pasuje do rodziny dystrybucji gamma?

Mam próbkę danych, która została wygenerowana z ciągłej zmiennej losowej X. I z histogramu, który rysuję za pomocą R, myślę, że może rozkład X jest zgodny z pewnym rozkładem gamma. Ale nie znam dokładnych parametrów tego rozkładu gamma. Moje pytanie brzmi: jak sprawdzić, czy rozkład X należy do rodziny rozkładów …

13 distributions hypothesis-testing goodness-of-fit gamma-distribution

2

Wykorzystanie statystycznego testu istotności do sprawdzenia poprawności wyników analizy skupień

Badam wykorzystanie statystycznego testowania istotności (SST) do walidacji wyników analizy skupień. Znalazłem kilka artykułów na ten temat, takich jak „ Statystyczne znaczenie grupowania dla danych o dużych wymiarach i małych próbkach ” Liu, Yufeng i in. (2008) „ O niektórych testach istotności w analizie skupień ”, Bock (1985) Ale jestem …

13 hypothesis-testing clustering statistical-significance

1

Test istotności różnicy współczynnika korelacji Spearmana

(Bardzo dziękuję za szybkie odpowiedzi! Zadałem kiepskie zadanie, więc pozwól mi spróbować ponownie.) Nie wiem, jak sprawdzić, czy różnica między dwiema korelacjami Spearmana jest statystycznie istotna. Chciałbym wiedzieć, jak się tego dowiedzieć. Powodem, dla którego chciałem się dowiedzieć, jest następujący artykuł: Semantyczna interpretacja semantyczna oparta na Wikipedii , opracowana przez …

13 hypothesis-testing statistical-significance spearman-rho

5

Czy można użyć chi kwadrat do porównania proporcji?

Czytałem, że test chi-kwadrat jest przydatny, aby sprawdzić, czy próbka znacznie różni się od zestawu wartości oczekiwanych. Na przykład, oto tabela wyników ankiety dotyczącej ulubionych kolorów ludzi (n = 15 + 13 + 10 + 17 = 55 wszystkich respondentów): red,blue,green,yellow 15,13,10,17 Test chi-kwadrat może mi powiedzieć, czy ta próbka …

13 chi-squared hypothesis-testing proportion

1

LARS vs zejście współrzędnych dla lasso

Jakie są zalety i wady korzystania z LARS [1] w porównaniu ze stosowaniem opadania współrzędnych w celu dopasowania regresji liniowej regulowanej przez L1? Interesują mnie głównie aspekty wydajności (moje problemy występują zwykle Nw setkach tysięcy i p<20). Jednak wszelkie inne spostrzeżenia byłyby również mile widziane. edytuj: Od kiedy opublikowałem pytanie, …

13 regression lasso regularization regression references lasso regularization elastic-net r distributions aggregation clustering algorithms regression correlation modeling distributions time-series standard-deviation goodness-of-fit hypothesis-testing statistical-significance sample binary-data estimation random-variable interpolation distributions probability chi-squared predictor outliers regression modeling interaction

4

Porównanie ogonów dwóch rozkładów próbek

Mam dwa zestawy danych, które są z grubsza wyśrodkowane wokół zera, ale podejrzewam, że mają różne ogony. Znam kilka testów, aby porównać rozkład z rozkładem normalnym, ale chciałbym porównać bezpośrednio te dwa rozkłady. Czy istnieje prosty test umożliwiający porównanie grubości ogona z 2 rozkładów ? Dzięki fRed

13 hypothesis-testing distributions kurtosis fat-tails

1

Testujesz dwie niezależne próbki pod kątem zerowości tego samego skosu?

Jakie testy są dostępne do testowania dwóch niezależnych próbek pod kątem hipotezy zerowej, że pochodzą one z populacji o tym samym przekrzywieniu? Istnieje klasyczny test na 1 próbce dla tego, czy pochylenie jest równe stałej liczbie (test obejmuje szósty moment próbki!); czy istnieje proste tłumaczenie na test na 2 próbkach? …

13 hypothesis-testing distributions bootstrap moments l-moments

1

Pakiet GBM vs. Caret korzystający z GBM

Stroiłem model przy użyciu caret, ale potem ponownie uruchomiłem model przy użyciu gbmpakietu. Rozumiem, że caretpakiet używa gbmi wynik powinien być taki sam. Jednak tylko szybki test przy użyciu data(iris)wykazuje rozbieżność w modelu około 5% przy użyciu RMSE i R ^ 2 jako metryki oceny. Chcę znaleźć optymalną wydajność modelu …

13 r caret gbm matrix linear-algebra logistic modeling logit ordered-logit r confidence-interval survival population weibull classification separation hypothesis-testing correlation statistical-significance p-value python r data-visualization r regression multiple-regression chi-squared multivariate-analysis distributions random-variable experiment-design distributions poisson-regression residuals excel time-series garch var survival modeling cox-model interaction r pca normality-assumption

2

Jak zdefiniować region odrzucenia, gdy nie ma UMP?

Rozważ model regresji liniowej y=Xβ+uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u} , u∼N(0,σ2I)u∼N.(0,σ2)ja)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}) , E(u∣X)=0mi(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0} . Niech vs .H0:σ20=σ2H.0:σ02)=σ2)H_0: \sigma_0^2=\sigma^2H1:σ20≠σ2H.1:σ02)≠σ2)H_1: \sigma_0^2\neq\sigma^2 Możemy wywnioskować, że , gdzie . A to typowy zapis dla matrycy anihilatora, , gdzie jest zmienną zależną zrestartował się w .yTMXyσ2∼χ2(n−k)yT.M.Xyσ2)∼χ2)(n-k)\frac{\mathbf{y}^T\mathbf{M_X}\mathbf{y}}{\sigma^2}\sim \chi^2(n-k)dim(X)=n×krejam(X)=n×kdim(\mathbf{X})=n\times kMXMX\mathbf{M_X}MXy=y^MXy=y^\mathbf{M_X}\mathbf{y}=\hat{\mathbf{y}}y^y^ \hat{\mathbf{y}}yy\mathbf{y}XX\mathbf{X} Książka, którą czytam, stwierdza, co następuje: Wcześniej zapytałem, jakie …

13 regression hypothesis-testing mathematical-statistics inference

2

Obserwujesz k głów z n rzutów. Czy monety są uczciwe?

Zadano mi to pytanie z w wywiadzie. Czy istnieje „poprawna” odpowiedź?(n,k)=(400,220)(n,k)=(400,220)(n, k) = (400, 220) Załóżmy, że rzuty są identyczne, a prawdopodobieństwo głów wynosi p=0.5p=0.5p=0.5 . Rozkład liczby głów w 400 rzutach powinien następnie być zbliżony do normalnego (200, 10 ^ 2), tak aby 220 głów było o 2 standardowe …

13 probability hypothesis-testing self-study prior

4

Co zrobić, gdy średnie z dwóch próbek są znacznie różne, ale różnica wydaje się zbyt mała, aby mogła mieć znaczenie

Mam dwie próbki ( w obu przypadkach). Średnie różnią się o około dwa razy tyle, ile zebrane standardowe. dev. Wynikowa wartość wynosi około 10. Chociaż dobrze wiedzieć, że ostatecznie wykazałem, że średnie nie są takie same, wydaje mi się, że wynika to z dużej n. Patrząc na histogramy danych, z …

13 hypothesis-testing t-test

3

Jak sprawdzić, czy macierz kowariancji zmieniła się w dwóch punktach czasowych?

Moim zadaniem jest przetestowanie, czy występuje zmiana w macierzy kowariancji 6 zmiennych. Wartości 6 zmiennych mierzy się dwukrotnie od tych samych podmiotów (3 lata między pomiarami). Jak mogę to zrobić? Większość pracy wykonywałem za pomocą SAS.

13 hypothesis-testing repeated-measures multivariate-analysis covariance-matrix

Pytania otagowane jako hypothesis-testing