Załóżmy, że mam małą próbkę, np. N = 100, i dwie klasy. Jak wybrać rozmiar zestawu szkoleniowego, walidacyjnego i testowego do uczenia maszynowego?
Intuicyjnie wybrałbym
- Rozmiar zestawu treningowego wynosi 50
- Zestaw do walidacji krzyżowej rozmiar 25 i
- Rozmiar testowy wynosi 25.
Ale prawdopodobnie ma to mniej lub bardziej sens. Jak naprawdę zdecydować o tych wartościach? Czy mogę wypróbować różne opcje (choć myślę, że nie jest to tak preferowane ... większa możliwość ponaduczenia się)?
Co jeśli miałbym więcej niż dwie klasy?