To bardzo podstawowe pytanie. Dlaczego używamy rozkładu chi-kwadrat? Jakie jest znaczenie tej dystrybucji? Dlaczego ten rozkład służy do tworzenia przedziału ufności dla wariancji? Każde miejsce, w którym szukam wyjaśnień, po prostu przedstawia ten fakt, wyjaśniając, kiedy używać chi, ale nie wyjaśniając, dlaczego używać chi i dlaczego wygląda tak, jak to …
Załóżmy, że XXX i YYY mają skończony drugi moment. W przestrzeni Hilberta zmiennych losowych z drugim momentem skończonym (z iloczynem wewnętrznym T1,T2T1,T2T_1,T_2 zdefiniowanym przez E(T1T2)E(T1T2)E(T_1T_2) , ||T||2=E(T2)||T||2=E(T2)||T||^2=E(T^2) ), możemy interpretować E(Y|X)E(Y|X)E(Y|X) w rzucie YYY na przestrzeni funkcji XXX . Wiemy również, że prawo całkowitej wariancji brzmi Var(Y)=E(Var(Y|X))+Var(E(Y|X))Var(Y)=E(Var(Y|X))+Var(E(Y|X))Var(Y)=E(Var(Y|X)) + Var(E(Y|X)) Czy …
Natknąłem się na transformację stabilizującą wariancję podczas czytania metody Kaggle Essay Eval . Używają transformacji stabilizacji wariancji, aby przekształcić wartości kappa przed pobraniem ich średniej, a następnie przekształcić je z powrotem. Nawet po przeczytaniu wiki o transformacjach stabilizujących wariancje nie rozumiem, dlaczego tak naprawdę stabilizujemy wariancje? Jakie korzyści dzięki temu …
pytania Czy to zależy od tego, czy drzewo jest płytkie czy głębokie? Czy możemy to powiedzieć niezależnie od głębokości / poziomów drzewa? Dlaczego odchylenie jest niskie, a wariancja wysoka? Proszę wyjaśnić intuicyjnie i matematycznie
Czytałem w kółko, że walidacja krzyżowa „Leave-one-out-out” ma dużą wariancję ze względu na duże nakładanie się fałdów treningowych. Nie rozumiem jednak, dlaczego tak jest: czy wydajność walidacji krzyżowej nie powinna być bardzo stabilna (niska wariancja) właśnie dlatego, że zestawy treningowe są prawie identyczne? Czy też źle rozumiem pojęcie „wariancji”? Nie …
Mam zestaw danych z 11 zmiennymi i PCA (ortogonalny) został zrobiony w celu zmniejszenia danych. Zdecydowanie o liczbie składników, które miałyby je zachować, było dla mnie oczywiste z mojej wiedzy na ten temat i wykresu piargowego (patrz poniżej), że dwa główne składniki (komputery osobiste) wystarczały do wyjaśnienia danych, a pozostałe …
Nie jestem zbyt dobry w statystyce, więc przepraszam, jeśli to proste pytanie. Dopasowuję krzywą do niektórych danych, a czasami moje dane najlepiej pasują do ujemnego wykładniczego w postaci * e( - b ∗ x )+ cza∗mi(-b∗x)+doa * e^{(-b * x)} + c , a czasami dopasowanie jest bliższe . Czasami …
Prowadzę eksperyment, w którym równolegle zbieram (niezależne) próbki, obliczam wariancję każdej grupy próbek, a teraz chcę połączyć wszystkie, aby znaleźć całkowitą wariancję wszystkich próbek. Trudno mi znaleźć na to pochodne, ponieważ nie jestem pewien terminologii. Myślę o tym jak o podziale jednego RV. Więc chcę znaleźć Var(X)Var(X)Var(X) z Var(X1)Var(X1)Var(X_1) , …
Użyłem terminu „przypadek Heywooda” w sposób nieco nieformalny, aby odnieść się do sytuacji, w których online, „skończona odpowiedź” iteracyjnie zaktualizowana ocena wariancji stała się negatywna z powodu problemów z precyzją liczbową. (Korzystam z wariantu metody Welforda, aby dodawać dane i usuwać starsze dane). Miałem wrażenie, że odnosi się to do …
θ^θ^\hat\thetaθ∗θ∗\theta^*nnn∥θ^−θ∗∥‖θ^−θ∗‖\lVert\hat\theta-\theta^*\rVertO(1/n−−√)O(1/n)O(1/\sqrt n)∥Eθ^−θ∗∥‖Eθ^−θ∗‖\lVert \mathbb E\hat\theta - \theta^*\rVert∥Eθ^−θ^∥‖Eθ^−θ^‖\lVert \mathbb E\hat\theta - \hat\theta\rVertO(1/n−−√)O(1/n)O(1/\sqrt{n}) Interesują mnie modele, które mają odchylenie, które zmniejsza się szybciej niż O(1/n−−√)O(1/n)O(1/\sqrt n) , ale w którym błąd nie zmniejsza się w tym szybszym tempie, ponieważ odchylenie nadal zmniejsza się jako O(1/n−−√)O(1/n)O(1/\sqrt n) . W szczególności chciałbym poznać warunki wystarczające …
Spojrzałem w górę w Internecie, ale nie mogłem znaleźć nic pomocnego. Zasadniczo szukam sposobu na zmierzenie, jak „równomiernie” rozkładana jest wartość. Jak w „równomiernie” rozproszonej dystrybucji, takiej jak X : oraz „nierównomiernie” rozkład Y o mniej więcej tej samej średniej i odchyleniu standardowym: Ale czy istnieje jakakolwiek miara równości m, …
Przeprowadziłem eksperyment, w którym wychowałem różne rodziny pochodzące z dwóch różnych populacji źródłowych. Każdej rodzinie przydzielono jeden z dwóch zabiegów. Po eksperymencie zmierzyłem kilka cech u każdej osoby. Aby przetestować wpływ leczenia lub źródła, a także ich interakcji, zastosowałem liniowy model efektu mieszanego z rodziną jako czynnikiem losowym, tj. lme(fixed=Trait~Treatment*Source,random=~1|Family,method="ML") …
Jestem nowicjuszem w statystyce i R i mam problem z używaniem funkcji Levene'a (chciałbym sprawdzić równość wariancji dwóch próbek). Dokumentacja mówi, że powinienem uruchomić: levene.test (y, grupa) Ale nie mam pojęcia, co powinienem umieścić jako y i grupę? Mam dwie różne próbki, z których chciałbym sprawdzić równość wariancji. Czy powinienem …
Wydaje się, że istnieje wiele zamieszania w porównaniu używania glmnetwewnątrz w caretcelu znalezienia optymalnej lambdy i korzystania cv.glmnetz tego samego zadania. Zadano wiele pytań, np .: Model klasyfikacji train.glmnet vs. cv.glmnet? Jaki jest właściwy sposób używania glmnet z karetką? Cross-validation `glmnet` za pomocą` caret` ale nie udzielono odpowiedzi, co może …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.