Wielowymiarowy, dyskretny rozkład prawdopodobieństwa używany do opisu wyników losowego eksperymentu, w którym każdy z n wyniki są umieszczane w jednym z k kategorie nominalne.
Istnieją różne metody przewidywania zmiennych porządkowych i kategorialnych. Nie rozumiem, jak ważne jest to rozróżnienie. Czy istnieje prosty przykład, który może wyjaśnić, co się stanie, jeśli złożę zamówienie? W jakich okolicznościach to nie ma znaczenia? Na przykład, jeśli wszystkie zmienne niezależne również są kategoryczne / porządkowe, czy byłaby różnica? To …
Następujący problem: chcę przewidzieć zmienną jakościową z jedną (lub więcej) zmiennymi jakościowymi za pomocą glmnet (). Nie mogę jednak zrozumieć, jaki wynik daje mi glmnet. Ok, najpierw wygenerujmy dwie powiązane zmienne jakościowe: Generuj dane p <- 2 #number variables mu <- rep(0,p) sigma <- matrix(rep(0,p^2), ncol=p) sigma[1,2] <- .8 #some …
Oto, co chcę zrobić, ale wydaje się, że nie ma predictmetody dla mlogit. Jakieś pomysły? library(mlogit) data("Fishing", package = "mlogit") Fish <- mlogit.data(Fishing, varying = c(2:9), shape = "wide", choice = "mode") Fish_fit<-Fish[-1,] Fish_test<-Fish[1,] m <- mlogit(mode ~price+ catch | income, data = Fish_fit) predict(m,newdata=Fish_test)
W swojej pracy widziałem kilka zastosowań dokładnego testu Fishera i zastanawiałem się, jak dobrze pasuje do moich danych. Patrząc na kilka źródeł, rozumiałem, jak obliczyć statystyki, ale nigdy nie widziałem jasnego i formalnego wyjaśnienia przyjętej hipotezy zerowej. Czy ktoś może mi wyjaśnić lub odesłać mnie do formalnego wyjaśnienia zakładanego podziału? …
To pytanie pochodzi z książki Van der Vaarta Asymptotic Statistics, str. 253. # 3: Załóżmy, że XmXm\mathbf{X}_m i YnYn\mathbf{Y}_n to niezależne wielomianowy wektorów parametrów (m,a1,…,ak)(m,a1,…,ak)(m,a_1,\ldots,a_k) a (n,b1,…,bk)(n,b1,…,bk)(n,b_1,\ldots,b_k) . Zgodnie z hipotezą zerową, że I = b I wskazują, żeai=biai=bia_i=b_i maχ 2 k - 1 dystrybucji. gdzie C i=(Xm,I+Yn,i)/(m+n).∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i\sum_{i=1}^k \dfrac{(X_{m,i} - …
\newcommand{\P}{\mathbb{P}} Rzucam sprawiedliwą kostką. Ilekroć dostaję 1, 2 lub 3, zapisuję „1”; za każdym razem, gdy dostaję 4, zapisuję „2”; za każdym razem, gdy dostaję 5 lub 6, zapisuję „3”. Niech będzie całkowitą liczbą rzutów, których potrzebuję, aby iloczyn wszystkich zapisanych przeze mnie liczb wynosił \ geq 100000 . Chcę …
Czy wykonalne jest kilka binarnych regresji logistycznych zamiast regresji wielomianowej? Z tego pytania: Wielomianowa regresja logistyczna a binarna regresja logistyczna jeden na jeden spostrzegam, że regresja wielomianowa może mieć niższe błędy standardowe. Jednak pakiet, którego chciałbym użyć, nie został uogólniony na regresję wielomianową ( ncvreg: http://cran.r-project.org/web/packages/ncvreg/ncvreg.pdf ), więc zastanawiałem się, …
Zamknięte . To pytanie wymaga szczegółów lub jasności . Obecnie nie przyjmuje odpowiedzi. Chcesz poprawić to pytanie? Dodaj szczegóły i wyjaśnij problem, edytując ten post . Zamknięte 2 lata temu . Czytam Luce (1959) . Potem znalazłem to oświadczenie: Kiedy dana osoba wybiera między alternatywami, bardzo często jej reakcje wydają …
Postaram się opisać problem tak ogólnie, jak to możliwe. Modeluję obserwacje jako rozkład kategoryczny z parametrem wektor prawdopodobieństwa theta. Następnie zakładam, że wektor parametrów theta podąża za rozkładem Dirichleta z parametrami α1,α2,…,αkα1,α2,…,αk\alpha_1,\alpha_2,\ldots,\alpha_k . Czy można zatem narzucić również rozkład hiperpriorów na parametry α1,α2,…,αkα1,α2,…,αk\alpha_1,\alpha_2,\ldots,\alpha_k ? Czy będzie to rozkład wielowymiarowy, taki …
Mam model regresji logistycznej dla wieloklasowej, który podaje P(Y=j|X(i))=exp(θTjX(i))1+∑km=1exp(θTmX(i))P(Y=j|X(i))=exp(θjTX(i))1+∑m=1kexp(θmTX(i)) P(Y=j|X^{(i)}) = \frac{\exp(\theta_j^TX^{(i)})}{1+ \sum_{m=1}^{k}\exp(\theta_m^T X^{(i)})} gdzie k to liczba klas theta to parametr do oszacowania j to j-ta klasa Xi to dane treningowe Cóż, jedna rzecz, której nie dostałem, to dlaczego część mianownika znormalizowała model. Mam na myśli, że prawdopodobieństwo pozostanie …
Mam nadzieję, że to pytanie dla początkujących jest właściwym pytaniem dla tej witryny: Załóżmy, że chciałbym porównać skład społeczności ekologicznych w dwóch miejscach A, B. Wiem, że wszystkie trzy miejsca mają psy, koty, krowy i ptaki, więc próbuję ich liczebności w każdym miejscu (tak naprawdę nie mam „ spodziewana „liczebność …
Szukam ograniczającego rozkładu wielomianowego w porównaniu do wyników d. IE, dystrybucja następujących limn→∞n−12Xnlimn→∞n−12Xn\lim_{n\to \infty} n^{-\frac{1}{2}} \mathbf{X_n} Gdzie XnXn\mathbf{X_n} jest losową zmienną o wartości wektorowej o gęstości fn(x)fn(x)f_n(\mathbf{x}) dla xx\mathbf{x} taką, że ∑ixi=n∑ixi=n\sum_i x_i=n , xi∈Z,xi≥0xi∈Z,xi≥0x_i\in \mathbb{Z}, x_i\ge 0 i 0 dla wszystkich innych xx\mathbf{x} , gdzie fn(x)=n!∏i=1dpxiixi!fn(x)=n!∏i=1dpixixi!f_{n}(\mathbf{x})=n!\prod_{i=1}^d\frac{p_i^{x_i}}{x_i!} Znalazłem jedną formę …
Potrzebuję algorytmu do próbkowania obciętego rozkładu wielomianowego. To jest, x⃗ ∼1Zpx11…pxkkx1! …xk!x→∼1Zp1x1…pkxkx1!…xk!\vec x \sim \frac{1}{Z} \frac{p_1^{x_1} \dots p_k^{x_k}}{x_1!\dots x_k!} gdzie ZZZ jest stałą normalizacyjną, x⃗ x→\vec x ma kkk pozytywne składniki i ∑xja= n∑xi=n\sum x_i = n. Rozważam tylko wartościx⃗ x→\vec{x} w zasięgu za⃗ ≤x⃗ ≤b⃗ a→≤x→≤b→\vec a \le \vec …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.