Ten znacznik wskazuje pytania dotyczące definicji terminów statystycznych. Użyj bardziej ogólnego znacznika [terminologia] w przypadku pytań dotyczących języka statystycznego, które nie dotyczą konkretnie definicji.
Bardzo mało wiem na temat prawdopodobieństwa i statystyki i chcę się uczyć. Widzę słowo „dystrybucja” używane wszędzie w różnych kontekstach. Na przykład dyskretna zmienna losowa ma „rozkład prawdopodobieństwa”. Wiem co to jest. Ciągła zmienna losowa ma funkcję gęstości prawdopodobieństwa, a zatem dla x∈Rx∈Rx\in\mathbb{R} całka od −∞−∞-\infty do xxx funkcji gęstości …
Eksperymentuję z algorytmem maszyny do zwiększania gradientu za pośrednictwem caretpakietu w R. Korzystając z małego zestawu danych o przyjęciach na studia, uruchomiłem następujący kod: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine …
Piszę o zastosowaniu „wspólnego rozkładu prawdopodobieństwa” dla odbiorców, którzy byliby bardziej skłonni zrozumieć „rozkład wielu zmiennych”, dlatego rozważam użycie późniejszego. Jednak nie chcę przy tym tracić sensu. Wikipedia zdaje się wskazywać, że są to synonimy. Czy oni są? Jeśli nie, dlaczego nie?
Użyłem terminu „przypadek Heywooda” w sposób nieco nieformalny, aby odnieść się do sytuacji, w których online, „skończona odpowiedź” iteracyjnie zaktualizowana ocena wariancji stała się negatywna z powodu problemów z precyzją liczbową. (Korzystam z wariantu metody Welforda, aby dodawać dane i usuwać starsze dane). Miałem wrażenie, że odnosi się to do …
To jest definicja statystyki na wikipedii Bardziej formalnie, teoria statystyczna definiuje statystykę jako funkcję próbki, w której sama funkcja jest niezależna od rozkładu próbki; to znaczy funkcję można określić przed realizacją danych. Pojęcie statystyki jest używane zarówno dla funkcji, jak i dla wartości funkcji dla danej próbki. Myślę, że rozumiem …
Obecnie przeglądam zestaw slajdów, który mam do „analizy czynnikowej” (o ile wiem, PCA). Wywodzi się w nim „podstawowe twierdzenie analizy czynnikowej”, które twierdzi, że macierz korelacji danych przechodzących do analizy ( ) można odzyskać za pomocą macierzy ładunków czynnikowych ( ):RR\bf RAA\bf A R=AA⊤R=AA⊤\bf R = AA^\top To mnie jednak …
Według M. Katza w jego książce Analiza wieloczynnikowa (sekcja 1.2, strona 6): „ Zdezorientator jest związany z czynnikiem ryzyka i przyczynowo związany z wynikiem. ” Dlaczego ten dezorientator musi być przyczynowo związany z wynikiem? Czy wystarczyłoby, aby osoba wprowadzająca zamieszanie kojarzyła się z wynikiem?
Jest to oczywiście kwestia definicji lub konwencji i praktycznie nie ma praktycznego znaczenia. Jeśli jest ustawiona na tradycyjną wartość 0,05, to czy wartość 0,0500000000000 ... jest uważana za statystycznie znaczącą, czy nie? Czy reguła definiująca istotność statystyczną jest zwykle uważana za lub ??p p < α p ≤ ααα\alphapppp<αp<αp < …
Kontekst tego pytania mieści się w ramach zdrowia, tj. Patrząc na jedną lub więcej terapii w leczeniu stanu. Wygląda na to, że nawet szanowani badacze mylą pojęcia skuteczność i skuteczność , używając tych zamiennie. Jak można myśleć o skuteczności w porównaniu ze skutecznością w sposób, który pomoże usunąć zamieszanie? Jakiego …
Wszędzie widziałem operatora w jakimś przeglądzie literatury na temat przyczynowości (patrz, na przykład, ten wpis na Wikipedii ). Nie mogę jednak znaleźć formalnej i ogólnej definicji tego operatora.do(x)do(x)do(x) Czy ktoś może wskazać mi dobre odniesienie w tej sprawie? Interesuje mnie ogólna definicja, a nie jej interpretacja w konkretnym eksperymencie.
Nie jestem w stanie zrozumieć, jak działa Thompson Sampling . Czytałem o Multi Arm Bandit i po przeczytaniu algorytmu Upper Confidence Bound Algorytm wiele tekstów sugerowało, że próbkowanie Thompsona działa lepiej niż UCB. Co to jest próbkowanie Thompsona, w laika lub po prostu? Zapraszam do dostarczenia artykułów referencyjnych w celu …
Żenująco proste pytanie - ale wydaje się, że nie zostało wcześniej zadane w Cross Validated: Jaka jest definicja modelu regresji? Także pytanie pomocnicze, Co to nie jest model regresji? Jeśli chodzi o to drugie, interesują mnie trudne przykłady, w których odpowiedź nie jest od razu oczywista, np. ARIMA lub GARCH.
Coraz częściej słyszę te słowa, ucząc się uczenia maszynowego. W rzeczywistości niektórzy ludzie zdobyli medal Fieldsa, pracując nad prawidłowością równań. Sądzę więc, że jest to termin, który przenosi się z fizyki statystycznej / matematyki na uczenie maszynowe. Oczywiście wiele osób, o które pytałem, nie mogło tego intuicyjnie wyjaśnić. Wiem, że …
Mam bardzo duży zestaw danych i brakuje około 5% wartości losowych. Te zmienne są ze sobą skorelowane. Poniższy przykładowy zestaw danych R jest tylko zabawkowym przykładem z fałszywymi skorelowanymi danymi. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.