Z grubsza mówiąc, wartość p daje prawdopodobieństwo zaobserwowanego wyniku eksperymentu, biorąc pod uwagę hipotezę (model). Mając to prawdopodobieństwo (wartość p), chcemy ocenić naszą hipotezę (jak prawdopodobne jest). Ale czy nie byłoby bardziej naturalne obliczanie prawdopodobieństwa hipotezy na podstawie obserwowanego wyniku? Więcej szczegółów Mamy monetę. Odwracamy go 20 razy i otrzymujemy …
Uczę się o uczeniu się przez wzmocnienie i staram się zrozumieć koncepcję nagrody dyskontowej. Zatem nagroda jest konieczna, aby powiedzieć systemowi, które pary stan-działanie są dobre, a które złe. Ale nie rozumiem, dlaczego zniżka jest konieczna. Dlaczego miałoby mieć znaczenie, czy dobry stan zostanie osiągnięty wkrótce, czy później? Rozumiem, że …
Ostatnio natknąłem się na tę tożsamość: E[E(Y|X,Z)|X]=E[Y|X]E[E(Y|X,Z)|X]=E[Y|X]E \left[ E \left(Y|X,Z \right) |X \right] =E \left[Y | X \right] Oczywiście jestem zaznajomiony z prostszą wersją tej reguły, a mianowicie, że ale nie byłem w stanie znaleźć uzasadnienia dla jego uogólnienie.E[E(Y|X)]=E(Y)E[E(Y|X)]=E(Y)E \left[ E \left(Y|X \right) \right]=E \left(Y\right) Byłbym wdzięczny, gdyby ktoś mógł …
Ok, to pytanie podtrzymuje mnie w nocy. Czy procedurę ładowania początkowego można interpretować jako przybliżenie niektórych procedur bayesowskich (z wyjątkiem ładowania początkowego bayesowskiego)? Bardzo podoba mi się „interpretacja” statystyki bayesowskiej, którą uważam za całkiem spójną i łatwą do zrozumienia. Jednak mam również słabość do procedury ładowania początkowego, która jest tak …
Kiedy czytam „średnią ruchomą” w odniesieniu do szeregu czasowego, myślę, że coś takiego jak , a może ważone średnia jak . (Zdaję sobie sprawę, że tak naprawdę są to modele AR (3), ale do tego skacze mój mózg.) Dlaczego modele MA (q) zawierają formuły terminów błędów lub „innowacji”? Co ma …
Jestem nowy w eksploracji danych i staram się trenować drzewo decyzyjne względem zestawu danych, który jest wysoce niezrównoważony. Mam jednak problemy ze słabą dokładnością predykcyjną. Dane obejmują studentów studiujących kursy, a zmienną klasową jest status kursu, który ma dwie wartości - Wycofany lub Bieżący. Wiek Pochodzenie etniczne Płeć Oczywiście ... …
Regularność za pomocą metod takich jak Ridge, Lasso, ElasticNet jest dość powszechna w przypadku regresji liniowej. Chciałem wiedzieć, co następuje: Czy te metody mają zastosowanie do regresji logistycznej? Jeśli tak, to czy istnieją jakieś różnice w sposobie ich wykorzystania do regresji logistycznej? Jeśli te metody nie mają zastosowania, w jaki …
Czy ktoś może wyjaśnić, co robią jednostki maxout w sieci neuronowej? Jak działają i czym różnią się od konwencjonalnych jednostek? Próbowałem przeczytać artykuł „Maxout Network” z 2013 r. Goodfellow i in. (z grupy profesora Yoshua Bengio), ale nie do końca to rozumiem.
Jaka jest główna różnica między oszacowaniem maksymalnego prawdopodobieństwa (MLE) a oszacowaniem metodą najmniejszych kwadratów (LSE)? Dlaczego nie możemy użyć MLE do przewidywania wartości w regresji liniowej i odwrotnie?yyy Każda pomoc na ten temat będzie bardzo mile widziana.
W mojej książce używam głównie „rozkładu Gaussa”, ale ktoś właśnie zasugerował przejście na „rozkład normalny”. Jakiś konsensus, którego terminu użyć dla początkujących? Oczywiście te dwa terminy są synonimami , więc nie jest to pytanie o treść, lecz jedynie kwestia tego, który termin jest częściej używany. I oczywiście używam obu terminów. …
Jakie są teoretyczne powody, aby nie obsługiwać brakujących wartości? Maszyny zwiększające gradient, drzewa regresji radzą sobie z brakującymi wartościami. Dlaczego Random Forest tego nie robi?
Mam natknąć się na twierdzeniu, że każda próbka bootstrap (lub workach drzewa) będą zawierały średnio około 2/32/32/3 z obserwacjami. I zrozumieć, że prawdopodobieństwo nie wybiera się w jednym z nnn czerpie nnn próbek z wymianą jest (1−1/n)n(1−1/n)n(1- 1/n)^n , co przekłada się na około 1/31/31/3 przypadek nie zostanie wybrane. Co …
Obecnie piszę artykuł z kilkoma analizami wielu regresji. Podczas gdy wizualizacja jednoczynnikowej regresji liniowej jest łatwa za pomocą wykresów rozrzutu, zastanawiałem się, czy istnieje jakiś dobry sposób na wizualizację wielu regresji liniowych? Obecnie rysuję wykresy punktowe, takie jak zmienna zależna vs. 1. zmienna niezależna, a następnie 2. zmienna niezależna itp. …
Jestem zdezorientowany. Nie rozumiem różnicy między ARiMR a procesem GARCH .. dla mnie są takie same nie? Oto proces (G) ARCH (p, q) σ2)t= α0+ ∑i = 1qαjar2)t - iA R CH.+ ∑i = 1pβjaσ2)t - iG A R CH.σt2=α0+∑i=1qαirt−i2⏟ARCH+∑i=1pβiσt−i2⏟GARCH\sigma_t^2 = \underbrace{ \underbrace{ \alpha_0 + \sum_{i=1}^q \alpha_ir_{t-i}^2} _{ARCH} + \sum_{i=1}^p\beta_i\sigma_{t-i}^2} …
Krótkie podsumowanie Dlaczego regresja logistyczna (z ilorazami szans) jest częściej stosowana w badaniach kohortowych z wynikami binarnymi, w przeciwieństwie do regresji Poissona (z względnym ryzykiem)? tło Z mojego doświadczenia wynika, że statystyki licencjackie i magisterskie oraz kursy epidemiologiczne na ogół uczą, że do modelowania danych z wynikami binarnymi należy stosować …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.