Pytania otagowane jako notation

W przypadku pytań dotyczących notacji statystycznej i notacji matematycznej używanej w statystyce.

1
Notacja w indeksie dolnym w oczekiwaniach
Jakie jest dokładne znaczenie notacji indeksu dolnego w oczekiwaniach warunkowych w ramach teorii miar? Te indeksy dolne nie pojawiają się w definicji warunkowego oczekiwania, ale możemy zobaczyć na przykład na tej stronie wikipedii . (Pamiętaj, że nie zawsze tak było, ta sama strona kilka miesięcy temu).EX[f(X)]EX[f(X)]\mathbb{E}_X[f(X)] Jakie powinno być na …


2
Dlaczego istnieją dwa różne formuły / notacje dotyczące utraty logistyki?
Widziałem dwa rodzaje formuł logistycznych strat. Możemy łatwo pokazać, że są identyczne, jedyną różnicą jest definicja etykiety yyy . Formułowanie / notacja 1, y∈{0,+1}y∈{0,+1}y \in \{0, +1\} : L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) gdzie , gdzie funkcja logistyczna odwzorowuje liczbę rzeczywistą na interwał 0,1.p=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)}βTxβTx\beta^T x Formulacja / notacja 2, :y∈{−1,+1}y∈{−1,+1}y \in …

3
Dlaczego w uczeniu maszynowym stosowane są indeksy górne zamiast indeksów dolnych?
Biorę kurs Andrew Ng na Machine Learning poprzez Coursera . W przypadku równań zamiast indeksów dolnych stosuje się indeks górny. Na przykład w poniższym równaniu użyto zamiast : x ix(i)x(i)x^{(i)}xixix_i J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(\theta_0, \theta_1) = \frac{1}{2m} \sum\limits_{i=1}^{m}{(h_\theta(x^{(i)}) - y^{(i)})^2} Najwyraźniej jest to powszechna praktyka. Moje pytanie brzmi: po co używać indeksów górnych …


2
Co oznacza superskrypt 2 indeks dolny 2 w kontekście norm?
Jestem nowy w optymalizacji. Ciągle widzę równania, które mają indeks górny 2 i indeks dolny 2 po prawej stronie normy. Na przykład tutaj jest równanie najmniejszych kwadratów min||Ax−b||22||Ax−b||22 ||Ax-b||^2_2 Wydaje mi się, że rozumiem indeks górny 2: oznacza to wyprostowanie wartości normy. Ale czym jest indeks dolny 2? Jak mam …

4
Czy w statystykach należy przyjąć, że oznacza czy logarytm naturalny ?
Studiuję statystyki i często spotykam formuły zawierające logi zawsze jestem zdezorientowany, jeśli powinienem interpretować to jako standardowe znaczenie log, tj. Podstawa 10, lub jeśli w statystyce log ogólnie przyjmuje się, że log naturalny ln. W szczególności studiuję estymację częstotliwości Good-Turinga jako przykład, ale moje pytanie jest bardziej ogólne.



2
Notacja macierzowa dla regresji logistycznej
W regresji liniowej (strata kwadratowa) za pomocą macierzy mamy bardzo zwięzłą notację dla celu minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Gdzie AAA to macierz danych, xxx to współczynniki, a bbb to odpowiedź. Czy istnieje podobna notacja macierzowa dla celu regresji logistycznej? Wszystkie oznaczenia widziałem nie może pozbyć się suma nad wszystkimi punktami …

2
Które oznaczenie i dlaczego:
Czy są to jedynie konwencje stylistyczne (kursywą lub nie kursywą), czy też istnieją istotne różnice w znaczeniu tych zapisów? Czy istnieją inne zapisy oznaczające „ prawdopodobieństwo ”, które należy wziąć pod uwagę w tym pytaniu?

1
Notacja estymatorów (tylda vs. kapelusz)
1. Czy istnieje jakaś konwencja nazewnictwa dotycząca czapki i symbolu tyldy w statystykach? Znalazłem β jest opisujący prognozy dla p ( Wikipedia ), ale również ~ β jest opisujący prognozy dla P ( Wolfram ). Czy jest jakaś różnica w znaczeniu? W Internecie znalazłem pewną różnicę, ale nie jestem pewien …
15 notation 

4
Jak przetrawić kontekst statystyczny?
Po pierwsze, przypuszczam, że nie wszyscy aktywni członkowie tej interesującej strony są statystykami. W przeciwnym razie pytanie zadane w następujący sposób nie ma sensu! Oczywiście ich szanuję, ale potrzebuję wyjaśnienia, które jest bardziej praktyczne niż koncepcyjne. Zacznę od przykładu z Wikipedii, aby zdefiniować point process: Niech S będzie lokalnie kompaktową …

4
Założenia dotyczące regresji resztkowej regresji
Dlaczego konieczne jest założenie podziału na błędy, tj yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , z ϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) . Dlaczego nie napisać? yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , z yi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) , gdzie w obu przypadkach ϵi=yi−y^ϵi=yi−y^\epsilon_i = y_i - \hat{y} . Podkreśliłem, że założenia dystrybucyjne dotyczą błędów, a …

3
Przejście od używania oprogramowania statystycznego do zrozumienia równań matematycznych?
Kontekst: Jestem doktorantem psychologii. Podobnie jak wielu doktorantów psychologii, wiem, jak wykonywać różne analizy statystyczne za pomocą oprogramowania statystycznego, aż po takie techniki, jak PCA, drzewa klasyfikacyjne i analiza skupień. Ale to nie jest naprawdę satysfakcjonujące, ponieważ chociaż potrafię wyjaśnić, dlaczego przeprowadziłem analizę i co oznaczają wskaźniki, nie potrafię wyjaśnić, …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.