W algorytmie modelu tematycznego LDA widziałem to założenie. Ale nie wiem, dlaczego wybrał dystrybucję Dirichleta? Nie wiem, czy możemy użyć Uniform Distribution na Multinomial jako parę?
Od jakiegoś czasu staram się zrozumieć ideę sprzężonych priorów w statystyce bayesowskiej, ale po prostu nie rozumiem. Czy ktoś może wyjaśnić ten pomysł w najprostszy możliwy sposób, być może wykorzystując jako przykład „przeor Gaussa”?
Niektóre dystrybucje mają sprzężone priory, a niektóre nie. Czy to rozróżnienie to tylko wypadek? To znaczy, robisz matematykę, i to działa w taki czy inny sposób, ale tak naprawdę nie mówi ci nic ważnego o rozkładzie, z wyjątkiem samego faktu? A może obecność lub brak koniugatu wcześniej odzwierciedla jakąś głębszą …
Jak przejść do obliczania tylnej z wcześniejszym N ~ (a, b) po zaobserwowaniu n punktów danych? Zakładam, że musimy obliczyć średnią próbki i wariancję punktów danych i wykonać jakieś obliczenia, które łączą tylną z wcześniejszą, ale nie jestem pewien, jak wygląda wzór kombinacji.
Czy istnieje wcześniejszy koniugat dla rozkładu Laplace'a ? Jeśli nie, to czy istnieje znane wyrażenie w formie zamkniętej, które aproksymuje tylne parametry rozkładu Laplace'a? Przeszukiwałem całkiem sporo bez powodzenia, więc moje obecne pytanie brzmi „nie” w powyższych pytaniach ...
Czy oprócz użyteczności jest jakieś uzasadnienie epistemiczne (matematyczne, filozoficzne, heurystyczne itp.) Dla używania sprzężonych priorów? A może jest to po prostu tyle, że zwykle jest to wystarczająco dobre przybliżenie i sprawia, że jest o wiele łatwiej?
Czy estymatory Bayesa są odporne na stronniczość selekcji? Większość artykułów omawiających oszacowanie w dużym wymiarze, np. Dane o sekwencji całego genomu, często porusza kwestię błędu selekcji. Błąd selekcji wynika z faktu, że chociaż mamy tysiące potencjalnych predyktorów, tylko kilka zostanie wybranych, a wnioskowanie zostanie przeprowadzone na wybranych. Proces przebiega zatem …
Poniżej znajduje się fragment wprowadzenia Bolstad do statystyki bayesowskiej . Dla wszystkich tych ekspertów może to być trywialne, ale nie rozumiem, w jaki sposób autor stwierdza, że nie musimy wykonywać żadnej integracji, aby obliczyć prawdopodobieństwo późniejsze dla pewnej wartości . Rozumiem drugie wyrażenie, którym jest proporcjonalność i skąd pochodzą wszystkie …
Przykłady: w opisie stanowiska mam zdanie: „Starszy inżynier Java w Wielkiej Brytanii”. Chcę użyć modelu głębokiego uczenia się, aby przewidzieć go jako 2 kategorie: English i IT jobs. Jeśli użyję tradycyjnego modelu klasyfikacji, może on przewidzieć tylko 1 etykietę z softmaxfunkcją na ostatniej warstwie. Dlatego mogę użyć 2 modelowych sieci …
Używamy plików cookie i innych technologii śledzenia w celu poprawy komfortu przeglądania naszej witryny, aby wyświetlać spersonalizowane treści i ukierunkowane reklamy, analizować ruch w naszej witrynie, i zrozumieć, skąd pochodzą nasi goście.
Kontynuując, wyrażasz zgodę na korzystanie z plików cookie i innych technologii śledzenia oraz potwierdzasz, że masz co najmniej 16 lat lub zgodę rodzica lub opiekuna.