Losowy las jest zbiorem drzew decyzyjnych tworzonych przez losowo wybierając tylko niektóre funkcje, aby zbudować każde drzewo z (a czasem pakowania danych treningowych). Najwyraźniej dobrze się uczą i generalizują. Czy ktoś zrobił MCMC próbkowanie przestrzeni drzewa decyzyjnego lub porównał je z losowymi lasami? Wiem, że uruchomienie MCMC i zapisanie wszystkich …
Zazwyczaj mam do czynienia z danymi, w których każda z wielu osób jest mierzona wiele razy w każdym z 2 lub więcej warunków. Ostatnio bawiłem się modelowaniem efektów mieszanych w celu oceny dowodów na różnice między warunkami, modelowanie individualjako efekt losowy. Aby zwizualizować niepewność dotyczącą prognoz z takiego modelowania, korzystałem …
Mam następujące pytanie do kursu, nad którym pracuję: Przeprowadź badanie Monte Carlo, aby oszacować prawdopodobieństwo pokrycia standardowego normalnego przedziału ufności bootstrapu i podstawowego przedziału ufności bootstrapu. Próbka z normalnej populacji i sprawdź empiryczne wskaźniki pokrycia dla średniej próby. Prawdopodobieństwa pokrycia dla standardowego normalnego CI bootstrap są łatwe: n = 1000; …
Chciałbym rozwiązać Project Euler 213, ale nie wiem od czego zacząć, ponieważ jestem laikiem w dziedzinie statystyki, zauważ, że wymagana jest dokładna odpowiedź, aby metoda Monte Carlo nie zadziałała. Czy mógłbyś polecić mi kilka tematów statystycznych do przeczytania? Proszę nie zamieszczać rozwiązania tutaj. Flea Circus Siatka kwadratów 30 × 30 …
Niezwykle częstą sytuacją w grafice komputerowej jest to, że kolor niektórych pikseli jest równy całce funkcji o wartościach rzeczywistych. Często funkcja jest zbyt skomplikowana, aby ją rozwiązać analitycznie, więc pozostaje nam przybliżenie numeryczne. Ale funkcja ta jest również często bardzo droga do obliczenia, dlatego jesteśmy bardzo ograniczeni liczbą próbek, które …
Gdy zestawu równań nie można rozwiązać analitycznie, możemy zastosować algorytm spadku gradientu. Wydaje się jednak, że istnieje również metoda symulacji Monte Carlo, która może być wykorzystana do rozwiązania problemów, które nie mają rozwiązań analitycznych. Jak powiedzieć, kiedy należy korzystać z opadania gradientu, a kiedy Monte Carlo? A może po prostu …
Załóżmy, że chcę próbkować z ciągłego rozkładu p ( x )p(x)p(x) . Jeśli mam wyrażenie ppp w formularzu p(x)=∑i=1∞aifi(x)p(x)=∑ja=1∞zajafaja(x)p(x) = \sum_{i=1}^\infty a_i f_i(x) ai⩾0,∑iai=1zaja⩾0,∑jazaja=1a_i \geqslant 0, \sum_i a_i= 1fifajaf_ippp Próbkowanie etykiety z prawdopodobieństwemijaiaizajaa_i PróbkowanieX∼fiX∼fajaX \sim f_i Czy można uogólnić tę procedurę, jeśli są czasami negatywne? Podejrzewam, że widziałem to gdzieś …
Obecnie używam bayesowskiego podejścia do oszacowania parametrów modelu składającego się z kilku ODE. Ponieważ mam 15 parametrów do oszacowania, moja przestrzeń próbkowania jest 15-wymiarowa, a moje poszukiwane rozmieszczenie z tyłu wydaje się mieć wiele lokalnych maksimów, które są bardzo odizolowane przez duże obszary o bardzo niskim prawdopodobieństwie. Prowadzi to do …
Testuję niezależność w tabeli awaryjności Nie wiem, czy test G czy test chi-kwadrat Pearsona jest lepszy. Rozmiar próbki jest w setkach, ale istnieją pewne niskie liczby komórek. Jak stwierdzono na stronie Wikipedii , przybliżenie rozkładu chi-kwadrat jest lepsze dla testu G niż dla testu chi-kwadrat Pearsona. Ale używam symulacji Monte …
Moje pytanie dotyczy wymaganej liczby symulacji dla metody analizy Monte Carlo. O ile widzę, wymagana liczba symulacji dla dowolnego dopuszczalnego błędu procentowego (np. 5) wynosi n = { 100 ⋅ z c ⋅ std ( x )mimiEn = { 100 ⋅ zdo⋅ standardowe ( x )mi⋅ średnia ( x )}2),n={100⋅zdo⋅std(x)mi⋅oznaczać(x)}2), …
Pracuję nad funkcją Monte Carlo do wyceny kilku aktywów o częściowo skorelowanych zwrotach. Obecnie właśnie generuję macierz kowariancji i przesyłam do rmvnorm()funkcji w R. (Generuje skorelowane wartości losowe). Jednak patrząc na rozkłady zysków danego składnika aktywów, zwykle nie jest on rozkładany. To jest naprawdę dwuczęściowe pytanie: 1) Jak mogę oszacować …
W moim programie muszę uruchomić N osobnych wątków, każdy z własnym RNG, który służy do próbkowania dużego zestawu danych. Muszę być w stanie zaszczepić cały ten proces jedną wartością, aby móc odtwarzać wyniki. Czy wystarczy po prostu sekwencyjnie zwiększać ziarno dla każdego indeksu? Obecnie używam numpytych, RandomStatektóre korzystają z generatora …
Łańcuch Markowa Monte Carlo jest metodą opartą na łańcuchach Markowa, która pozwala nam uzyskać próbki (w ustawieniu Monte Carlo) z niestandardowych rozkładów, z których nie możemy bezpośrednio pobierać próbek. Moje pytanie brzmi: dlaczego sieć Markowa jest „najnowocześniejsza” do próbkowania Monte Carlo. Alternatywnym pytaniem może być: czy istnieją inne sposoby, takie …
To tylko przykład, na który natknąłem się kilka razy, więc nie mam żadnych przykładowych danych. Uruchamianie modelu regresji liniowej w R: a.lm = lm(Y ~ x1 + x2) x1jest zmienną ciągłą. x2jest kategoryczny i ma trzy wartości, np. „Niska”, „Średnia” i „Wysoka”. Jednak dane wyjściowe podane przez R byłyby mniej …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.