Zasadniczo nie, ale potencjalnie tak przy złym określeniu. Problem, którego szukasz, nazywa się dopuszczalnością. Decyzja jest dopuszczalna, jeśli nie ma mniej ryzykownego sposobu jej obliczenia.
Wszystkie rozwiązania bayesowskie są dopuszczalne, a rozwiązania nie bayesowskie są dopuszczalne, o ile albo pasują do rozwiązania bayesowskiego w każdej próbce, albo na granicy. Dopuszczalne rozwiązanie dla częstych lub bayesowskich zawsze pokonuje rozwiązanie ML, chyba że jest również dopuszczalne. To powiedziawszy, istnieje kilka praktycznych uwag, które sprawiają, że to stwierdzenie jest prawdziwe, ale puste.
Po pierwsze, pierwszeństwo dla opcji bayesowskiej musi być twoim prawdziwym przeorem, a nie jakąś wcześniejszą dystrybucją używaną do uszczęśliwienia redaktora czasopisma. Po drugie, wiele rozwiązań Frequentist jest niedopuszczalnych i zamiast standardowego rozwiązania należy zastosować estymator skurczu. Wiele osób nie zdaje sobie sprawy z lematu Stein'a i jego konsekwencji dla błędu braku próby. Wreszcie, ML może być nieco bardziej odporny, w wielu przypadkach, na błąd błędnej specyfikacji.
Kiedy przechodzisz do drzew decyzyjnych, a ich kuzyni do lasów, nie używasz podobnej metodologii, chyba że używasz również czegoś podobnego do sieci Bayesa. Rozwiązanie graficzne zawiera znaczną ilość informacji niejawnych, w szczególności wykres ukierunkowany. Ilekroć dodajesz informacje do procesu probabilistycznego lub statystycznego, zmniejszasz zmienność wyniku i zmieniasz to, co można by uznać za dopuszczalne.
Jeśli spojrzysz na uczenie maszynowe z perspektywy kompozycji funkcji, staje się ono po prostu rozwiązaniem statystycznym, ale używa przybliżeń, aby rozwiązanie było wykonalne. W przypadku rozwiązań bayesowskich MCMC oszczędza niewiarygodną ilość czasu, podobnie jak obniżanie gradientu dla wielu problemów ML. Gdybyś albo musiał skonstruować dokładny tył, aby zintegrować lub użyć brutalnej siły w wielu problemach ML, Układ Słoneczny umarłby śmiercią cieplną, zanim dostaniesz odpowiedź.
Domyślam się, że masz źle określony model dla tych, którzy używają statystyk lub nieodpowiednich statystyk. Uczyłem wykładu, w którym udowodniłem, że noworodki wypływają z okien, jeśli nie są odpowiednio owinięte, i gdzie metoda bayesowska tak radykalnie przewyższyła metodę częstokroć przy wyborze wielomianowym, że metoda częstokroć złamała się nawet w oczekiwaniu, podczas gdy metoda bayesowska podwoiła pieniądze uczestników . Teraz wykorzystałem statystykę w tym pierwszym i skorzystałem z niedopuszczalności estymatora Frequentist w drugim, ale naiwny użytkownik statystyk mógł łatwo zrobić to, co zrobiłem. Po prostu uczyniłem je ekstremalnymi, aby przykłady były oczywiste, ale użyłem absolutnie prawdziwych danych.
Losowe lasy są spójnymi estymatorami i wydają się przypominać pewne procesy bayesowskie. Z powodu powiązania z estymatorami jądra mogą być one dość blisko. Jeśli zauważysz istotną różnicę w wydajności między typami rozwiązań, oznacza to, że w podstawowym problemie jest coś, czego nie rozumiesz, a jeśli problem ma jakiekolwiek znaczenie, naprawdę musisz poszukać źródła różnicy, ponieważ może to być również jeśli wszystkie modele są błędnie określone.