Powiedz, że mam dwie metody uczenia się dla problemu klasyfikacji , i , i że oceniam ich wydajność uogólniającą za pomocą czegoś takiego jak wielokrotne sprawdzanie poprawności lub ładowanie początkowe. Z tego procesu otrzymuję rozkład wyników i dla każdej metody w tych powtórzeniach (np. Rozkład wartości ROC AUC dla każdego modelu).B. P B
Patrząc na tych rozkładów, to może być to, że ale (czyli oczekiwana wydajność uogólnienie jest większe niż , ale to jest więcej o tym niepewność oszacowania).σ A ≥ σ B A B
Myślę, że nazywa się to dylematem wariancji odchylenia w regresji.
Jakich metod matematycznych mogę użyć do porównania i i ewentualnie podjęcia świadomej decyzji o wyborze modelu?P B
Uwaga: Dla uproszczenia mam tu na myśli dwie metody i , ale interesują mnie metody, które można wykorzystać do porównania rozkładu wyników ~ 1000 metod uczenia się (np. Z przeszukiwania siatki) i ostatecznie ostateczna decyzja o tym, którego modelu użyć.B.