Jakie jest dokładne znaczenie notacji indeksu dolnego w oczekiwaniach warunkowych w ramach teorii miar? Te indeksy dolne nie pojawiają się w definicji warunkowego oczekiwania, ale możemy zobaczyć na przykład na tej stronie wikipedii . (Pamiętaj, że nie zawsze tak było, ta sama strona kilka miesięcy temu).EX[f(X)]EX[f(X)]\mathbb{E}_X[f(X)] Jakie powinno być na …
Jaka jest różnica w znaczeniu między zapisem i które są powszechnie używane w wielu książkach i artykułach?P ( z | d , w )P(z;d,w)P(z;d,w)P(z;d,w)P(z|d,w)P(z|d,w)P(z|d,w)
Widziałem dwa rodzaje formuł logistycznych strat. Możemy łatwo pokazać, że są identyczne, jedyną różnicą jest definicja etykiety yyy . Formułowanie / notacja 1, y∈{0,+1}y∈{0,+1}y \in \{0, +1\} : L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog(p)−(1−y)log(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) gdzie , gdzie funkcja logistyczna odwzorowuje liczbę rzeczywistą na interwał 0,1.p=11+exp(−βTx)p=11+exp(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)}βTxβTx\beta^T x Formulacja / notacja 2, :y∈{−1,+1}y∈{−1,+1}y \in …
Biorę kurs Andrew Ng na Machine Learning poprzez Coursera . W przypadku równań zamiast indeksów dolnych stosuje się indeks górny. Na przykład w poniższym równaniu użyto zamiast : x ix(i)x(i)x^{(i)}xixix_i J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(\theta_0, \theta_1) = \frac{1}{2m} \sum\limits_{i=1}^{m}{(h_\theta(x^{(i)}) - y^{(i)})^2} Najwyraźniej jest to powszechna praktyka. Moje pytanie brzmi: po co używać indeksów górnych …
Jakie jest znaczenie tyldy przy określaniu rozkładów prawdopodobieństwa? Na przykład: Z∼ Normalny ( 0 , 1 ) .Z∼Normalna(0,1).Z \sim \mbox{Normal}(0,1).
Jestem nowy w optymalizacji. Ciągle widzę równania, które mają indeks górny 2 i indeks dolny 2 po prawej stronie normy. Na przykład tutaj jest równanie najmniejszych kwadratów min||Ax−b||22||Ax−b||22 ||Ax-b||^2_2 Wydaje mi się, że rozumiem indeks górny 2: oznacza to wyprostowanie wartości normy. Ale czym jest indeks dolny 2? Jak mam …
Studiuję statystyki i często spotykam formuły zawierające logi zawsze jestem zdezorientowany, jeśli powinienem interpretować to jako standardowe znaczenie log, tj. Podstawa 10, lub jeśli w statystyce log ogólnie przyjmuje się, że log naturalny ln. W szczególności studiuję estymację częstotliwości Good-Turinga jako przykład, ale moje pytanie jest bardziej ogólne.
Ogólnie, jaka jest różnica między E ( X | Y )E(X|Y)E(X|Y) i E ( X | Y = y )E(X|Y=y)E(X|Y=y) ? Poprzednia jest funkcją y,yy a ostatnia jest funkcją xxx ? To takie mylące ...
Wzory modelowe w R, takie jak y ~ x + a*b + c:d oparte są na tak zwanej notacji Wilkinsona : Wilkinson i Rogers 1973, Symboliczny opis modeli czynnikowych do analizy wariancji . Ten artykuł nie omawiał notacji dla modeli mieszanych (które mogły wtedy nie istnieć). Skąd więc wzięły się …
W regresji liniowej (strata kwadratowa) za pomocą macierzy mamy bardzo zwięzłą notację dla celu minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Gdzie AAA to macierz danych, xxx to współczynniki, a bbb to odpowiedź. Czy istnieje podobna notacja macierzowa dla celu regresji logistycznej? Wszystkie oznaczenia widziałem nie może pozbyć się suma nad wszystkimi punktami …
Czy są to jedynie konwencje stylistyczne (kursywą lub nie kursywą), czy też istnieją istotne różnice w znaczeniu tych zapisów? Czy istnieją inne zapisy oznaczające „ prawdopodobieństwo ”, które należy wziąć pod uwagę w tym pytaniu?
1. Czy istnieje jakaś konwencja nazewnictwa dotycząca czapki i symbolu tyldy w statystykach? Znalazłem β jest opisujący prognozy dla p ( Wikipedia ), ale również ~ β jest opisujący prognozy dla P ( Wolfram ). Czy jest jakaś różnica w znaczeniu? W Internecie znalazłem pewną różnicę, ale nie jestem pewien …
Po pierwsze, przypuszczam, że nie wszyscy aktywni członkowie tej interesującej strony są statystykami. W przeciwnym razie pytanie zadane w następujący sposób nie ma sensu! Oczywiście ich szanuję, ale potrzebuję wyjaśnienia, które jest bardziej praktyczne niż koncepcyjne. Zacznę od przykładu z Wikipedii, aby zdefiniować point process: Niech S będzie lokalnie kompaktową …
Dlaczego konieczne jest założenie podziału na błędy, tj yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , z ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) . Dlaczego nie napisać? yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , z yi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) , gdzie w obu przypadkach ϵi=yi−y^ϵi=yi−y^\epsilon_i = y_i - \hat{y} . Podkreśliłem, że założenia dystrybucyjne dotyczą błędów, a …
Kontekst: Jestem doktorantem psychologii. Podobnie jak wielu doktorantów psychologii, wiem, jak wykonywać różne analizy statystyczne za pomocą oprogramowania statystycznego, aż po takie techniki, jak PCA, drzewa klasyfikacyjne i analiza skupień. Ale to nie jest naprawdę satysfakcjonujące, ponieważ chociaż potrafię wyjaśnić, dlaczego przeprowadziłem analizę i co oznaczają wskaźniki, nie potrafię wyjaśnić, …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.