TŁO: Pomiń bezpiecznie - jest tutaj w celach informacyjnych i uzasadnia pytanie. Otwarcie tego artykułu brzmi: „Słynny test przygodności chi-kwadrat Karla Pearsona pochodzi z innej statystyki, zwanej statystyką z, opartej na rozkładzie normalnym. Najprostsze wersje mogą być matematycznie identyczne z równoważnymi testami z. Testy dają taki sam wynik we wszystkich …
Testy permutacyjne (zwane również testem randomizacji, testem ponownej randomizacji lub testem dokładnym) są bardzo przydatne i przydają się, gdy t-testnie jest spełnione założenie o rozkładzie normalnym wymagane na przykład i gdy transformacja wartości przez ranking test nieparametryczny, Mann-Whitney-U-testktóry prowadziłby do utraty większej ilości informacji. Jednak nie należy zapominać o jednym …
To bardzo podstawowe pytanie. Dlaczego używamy rozkładu chi-kwadrat? Jakie jest znaczenie tej dystrybucji? Dlaczego ten rozkład służy do tworzenia przedziału ufności dla wariancji? Każde miejsce, w którym szukam wyjaśnień, po prostu przedstawia ten fakt, wyjaśniając, kiedy używać chi, ale nie wyjaśniając, dlaczego używać chi i dlaczego wygląda tak, jak to …
Oczekiwana wartość rozkładu jest średnią, to znaczy średnią ważoną E [ x ] = ∫ + ∞ - ∞ xf(x)f(x)f(x)E[x]=∫+∞−∞xf(x)dxE[x]=∫−∞+∞xf(x)dxE[x]=\int_{-\infty}^{+\infty} x \, \, f(x) dx Najbardziej prawdopodobną wartością jest tryb, czyli najbardziej prawdopodobna wartość. Czy jednak spodziewamy się, że jakoś zobaczymy wiele razy? Cytowanie stąd :E[x]E[x]E[x] Jeżeli wyniki nie są …
Wiem, że dla każdej pary klas obiektów wartość statystyki chi-kwadrat jest obliczana i porównywana z wartością progową. Jestem trochę zmieszany. Jeśli istnieje cech i klas , jak buduje się tabelę awaryjną? Jak decydować, które funkcje zachować, a które usunąć?mmmkkk Wszelkie wyjaśnienia będą mile widziane. Z góry dziękuję
Niech będzie rozkładem losowym zmiennej kwadratowej chi o k stopniach swobody. Jakie są najostrzejsze znane granice następujących prawdopodobieństwX∼ χ2)kX∼χk2X \sim \chi^2_kkkk P [X> t ] ≤ 1 - δ1( t , k )P[X>t]≤1−δ1(t,k) \mathbb{P}[X > t] \leq 1 - \delta_1(t, k) i P [X< z] ≤ 1 - δ2)( z, …
Jeśli gdzie X i ∼ N ( 0 , σ 2 ) , tj. Wszystkie X i są normalnymi losowymi zmiennymi o średniej zerowej z tymi samymi wariancjami, to Y ∼ Γ ( NY=∑i=1NX2iY=∑i=1NXi2Y=\sum_{i=1}^{N}X_i^2Xi∼N(0,σ2)Xi∼N(0,σ2)X_i \sim \mathcal{N}(0,\sigma^2)XiXiX_iY∼Γ(N2,2σ2).Y∼Γ(N2,2σ2).Y \sim \Gamma\left(\frac{N}{2},2\sigma^2\right). Znam rozkład chi-kwadrat jest szczególnym przypadkiem rozkładu gamma, ale nie mógł czerpać …
Jak Pearson opracował następujące statystyki chi-kwadrat Pearsona w 1900 roku? K=∑(Oij−Eij)2EijK=∑(Oij−Eij)2Eij K = \sum \frac{(O_{ij} -E_{ij})^2}{E_{ij}} that K∼χ2K∼χ2 K \sim \chi^2 Czy miał na myśli chi-kwadrat i opracował metrykę KKK (podejście od dołu do góry), czy też opracował statystyki, a później udowodnił, że podąża ona za rozkładem chi-kwadrat (z góry …
następujący problem pojawił się ostatnio podczas analizy danych. Jeśli zmienna losowa X podąża za rozkładem normalnym, a Y za (z n dof), jak rozkłada się ? Do tej pory wymyśliłem pdf : χ2nχn2\chi^2_nZ=X2+Y2Z=X2+Y2Z = X^2 + Y^2Y2Y2Y^2ψ2n(x)====∂F(x−−√)∂x(∫x√0tn/2−1⋅e−t/22n/2Γ(n/2)dt)′x12n/2Γ(n/2)⋅(x−−√)n/2−1⋅e−x√/2⋅(x−−√)′x12n/2−1Γ(n/2)⋅xn/4−1⋅e−x√/2ψn2(x)=∂F(x)∂x=(∫0xtn/2−1⋅e−t/22n/2Γ(n/2)dt)x′=12n/2Γ(n/2)⋅(x)n/2−1⋅e−x/2⋅(x)x′=12n/2−1Γ(n/2)⋅xn/4−1⋅e−x/2\begin{eqnarray} \psi^2_n(x) &=& \frac{\partial F(\sqrt{x})}{\partial x} \\ &=& \left( \int_0^{\sqrt{x}} \frac{t^{n/2-1}\cdot e^{-t/2}}{2^{n/2}\Gamma(n/2)} \mathrm{d}t \right)^\prime_x …
Mam dane testowe, w których mam kilka dużych próbek z rozkładów dyskretnych, których używam jako rozkłady empiryczne. Chcę przetestować, czy rozkłady są rzeczywiście różne i jaka jest różnica w średnich dla tych rozkładów, które są naprawdę różne. Ponieważ są to rozkłady dyskretne, rozumiem, że test Kołmogorowa-Smirnowa jest nieważny z uwagi …
Aby znaleźć związek między wsparciem rówieśnika (zmienna niezależna) a satysfakcją z pracy (zmienna zależna), chcę zastosować test chi-kwadrat. Wsparcie rówieśników to kategorie w czterech grupach według stopnia wsparcia: 1 = bardzo mniej, 2 = do pewnego stopnia, 3 = w dużym stopniu i 4 = w bardzo dużym stopniu. Zadowolenie …
To pytanie jest inspirowane minigierką Pokemon Soulsilver: Wyobraź sobie, że na tym obszarze 5x6 jest ukrytych 15 bomb (EDYCJA: maksymalnie 1 bomba / komórka): Jak oszacowałbyś prawdopodobieństwo znalezienia bomby na określonym polu, biorąc pod uwagę sumy wierszy / kolumn? Jeśli spojrzysz na kolumnę 5 (suma bomb = 5), możesz pomyśleć: …
Czytałem, że test chi-kwadrat jest przydatny, aby sprawdzić, czy próbka znacznie różni się od zestawu wartości oczekiwanych. Na przykład, oto tabela wyników ankiety dotyczącej ulubionych kolorów ludzi (n = 15 + 13 + 10 + 17 = 55 wszystkich respondentów): red,blue,green,yellow 15,13,10,17 Test chi-kwadrat może mi powiedzieć, czy ta próbka …
Jakie są zalety i wady korzystania z LARS [1] w porównaniu ze stosowaniem opadania współrzędnych w celu dopasowania regresji liniowej regulowanej przez L1? Interesują mnie głównie aspekty wydajności (moje problemy występują zwykle Nw setkach tysięcy i p<20). Jednak wszelkie inne spostrzeżenia byłyby również mile widziane. edytuj: Od kiedy opublikowałem pytanie, …
Stroiłem model przy użyciu caret, ale potem ponownie uruchomiłem model przy użyciu gbmpakietu. Rozumiem, że caretpakiet używa gbmi wynik powinien być taki sam. Jednak tylko szybki test przy użyciu data(iris)wykazuje rozbieżność w modelu około 5% przy użyciu RMSE i R ^ 2 jako metryki oceny. Chcę znaleźć optymalną wydajność modelu …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.