Gdy czytam stronę, większość odpowiedzi sugeruje, że w algorytmach uczenia maszynowego należy przeprowadzić weryfikację krzyżową. Jednak czytając książkę „Zrozumienie uczenia maszynowego” zobaczyłem, że istnieje ćwiczenie, które czasami lepiej nie używać weryfikacji krzyżowej. Jestem bardzo zmieszany. Kiedy algorytm uczący dla całych danych jest lepszy niż walidacja krzyżowa? Czy zdarza się to w prawdziwych zestawach danych?
Niech be k klasy hipotez. Załóżmy, że podano m IID szkolenia przykłady i chcesz uczyć się klasy H = ∪ k i = 1 H í . Rozważ dwa alternatywne podejścia:
Naucz się na m przykładach przy użyciu reguły ERM
Podziel m przykłady na zestaw treningowy wielkości zestaw walidacyjny wielkości α m dla niektórych α ∈ ( 0 , 1 ) . Następnie zastosuj podejście wyboru modelu za pomocą walidacji. Oznacza to, że fi RST pociągu każdej klasy H I na ( 1 - α ) m przykładami treningu z wykorzystaniem reguły ERM względem H ı i pozwolić godzinie h 1 , ... , h kbyć wynikającymi z tego hipotezami. Po drugie, należy zastosować regułę ERM w odniesieniu do klasy fi nite { h 1 , ... , h k } na α m przykłady walidacji.
Opisz scenariusze, w których pierwsza metoda jest lepsza niż druga i odwrotnie.