Słyszałem więc, że powiedziano, że wybór jednego testu statystycznego na podstawie wyniku innego nie jest dobrym pomysłem. Wydaje mi się to jednak dziwne. Na przykład ludzie często wybierają test nieparametryczny, gdy niektóre inne testy sugerują, że reszty nie są normalnie rozłożone. To podejście wydaje się dość powszechnie akceptowane, ale nie …
Studiując kurs statystyki, starałem się zrozumieć różnicę między testami hipotez jedno- i dwustronnych. W szczególności dlaczego test jednostronny odrzuca wartość zerową, podczas gdy test dwustronny nie? Przykład:
Mam próbkę danych, która została wygenerowana z ciągłej zmiennej losowej X. I z histogramu, który rysuję za pomocą R, myślę, że może rozkład X jest zgodny z pewnym rozkładem gamma. Ale nie znam dokładnych parametrów tego rozkładu gamma. Moje pytanie brzmi: jak sprawdzić, czy rozkład X należy do rodziny rozkładów …
Badam wykorzystanie statystycznego testowania istotności (SST) do walidacji wyników analizy skupień. Znalazłem kilka artykułów na ten temat, takich jak „ Statystyczne znaczenie grupowania dla danych o dużych wymiarach i małych próbkach ” Liu, Yufeng i in. (2008) „ O niektórych testach istotności w analizie skupień ”, Bock (1985) Ale jestem …
(Bardzo dziękuję za szybkie odpowiedzi! Zadałem kiepskie zadanie, więc pozwól mi spróbować ponownie.) Nie wiem, jak sprawdzić, czy różnica między dwiema korelacjami Spearmana jest statystycznie istotna. Chciałbym wiedzieć, jak się tego dowiedzieć. Powodem, dla którego chciałem się dowiedzieć, jest następujący artykuł: Semantyczna interpretacja semantyczna oparta na Wikipedii , opracowana przez …
Czytałem, że test chi-kwadrat jest przydatny, aby sprawdzić, czy próbka znacznie różni się od zestawu wartości oczekiwanych. Na przykład, oto tabela wyników ankiety dotyczącej ulubionych kolorów ludzi (n = 15 + 13 + 10 + 17 = 55 wszystkich respondentów): red,blue,green,yellow 15,13,10,17 Test chi-kwadrat może mi powiedzieć, czy ta próbka …
Jakie są zalety i wady korzystania z LARS [1] w porównaniu ze stosowaniem opadania współrzędnych w celu dopasowania regresji liniowej regulowanej przez L1? Interesują mnie głównie aspekty wydajności (moje problemy występują zwykle Nw setkach tysięcy i p<20). Jednak wszelkie inne spostrzeżenia byłyby również mile widziane. edytuj: Od kiedy opublikowałem pytanie, …
Mam dwa zestawy danych, które są z grubsza wyśrodkowane wokół zera, ale podejrzewam, że mają różne ogony. Znam kilka testów, aby porównać rozkład z rozkładem normalnym, ale chciałbym porównać bezpośrednio te dwa rozkłady. Czy istnieje prosty test umożliwiający porównanie grubości ogona z 2 rozkładów ? Dzięki fRed
Jakie testy są dostępne do testowania dwóch niezależnych próbek pod kątem hipotezy zerowej, że pochodzą one z populacji o tym samym przekrzywieniu? Istnieje klasyczny test na 1 próbce dla tego, czy pochylenie jest równe stałej liczbie (test obejmuje szósty moment próbki!); czy istnieje proste tłumaczenie na test na 2 próbkach? …
Stroiłem model przy użyciu caret, ale potem ponownie uruchomiłem model przy użyciu gbmpakietu. Rozumiem, że caretpakiet używa gbmi wynik powinien być taki sam. Jednak tylko szybki test przy użyciu data(iris)wykazuje rozbieżność w modelu około 5% przy użyciu RMSE i R ^ 2 jako metryki oceny. Chcę znaleźć optymalną wydajność modelu …
Rozważ model regresji liniowej y=Xβ+uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u} , u∼N(0,σ2I)u∼N.(0,σ2)ja)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}) , E(u∣X)=0mi(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0} . Niech vs .H0:σ20=σ2H.0:σ02)=σ2)H_0: \sigma_0^2=\sigma^2H1:σ20≠σ2H.1:σ02)≠σ2)H_1: \sigma_0^2\neq\sigma^2 Możemy wywnioskować, że , gdzie . A to typowy zapis dla matrycy anihilatora, , gdzie jest zmienną zależną zrestartował się w .yTMXyσ2∼χ2(n−k)yT.M.Xyσ2)∼χ2)(n-k)\frac{\mathbf{y}^T\mathbf{M_X}\mathbf{y}}{\sigma^2}\sim \chi^2(n-k)dim(X)=n×krejam(X)=n×kdim(\mathbf{X})=n\times kMXMX\mathbf{M_X}MXy=y^MXy=y^\mathbf{M_X}\mathbf{y}=\hat{\mathbf{y}}y^y^ \hat{\mathbf{y}}yy\mathbf{y}XX\mathbf{X} Książka, którą czytam, stwierdza, co następuje: Wcześniej zapytałem, jakie …
Zadano mi to pytanie z w wywiadzie. Czy istnieje „poprawna” odpowiedź?(n,k)=(400,220)(n,k)=(400,220)(n, k) = (400, 220) Załóżmy, że rzuty są identyczne, a prawdopodobieństwo głów wynosi p=0.5p=0.5p=0.5 . Rozkład liczby głów w 400 rzutach powinien następnie być zbliżony do normalnego (200, 10 ^ 2), tak aby 220 głów było o 2 standardowe …
Mam dwie próbki ( w obu przypadkach). Średnie różnią się o około dwa razy tyle, ile zebrane standardowe. dev. Wynikowa wartość wynosi około 10. Chociaż dobrze wiedzieć, że ostatecznie wykazałem, że średnie nie są takie same, wydaje mi się, że wynika to z dużej n. Patrząc na histogramy danych, z …
Moim zadaniem jest przetestowanie, czy występuje zmiana w macierzy kowariancji 6 zmiennych. Wartości 6 zmiennych mierzy się dwukrotnie od tych samych podmiotów (3 lata między pomiarami). Jak mogę to zrobić? Większość pracy wykonywałem za pomocą SAS.
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.