Zauważyłem to mylące, gdy korzystam z przybornika sieci neuronowej w Matlabie.
Podzielił nieprzetworzony zestaw danych na trzy części:
- zestaw treningowy
- zestaw sprawdzania poprawności
- zestaw testowy
Zauważam, że w wielu algorytmach szkoleniowych lub uczących się dane często dzielą się na 2 części, zestaw szkoleniowy i zestaw testowy.
Moje pytania to:
- jaka jest różnica między zestawem walidacyjnym a zestawem testowym?
- Czy zestaw walidacyjny jest naprawdę specyficzny dla sieci neuronowej? Lub jest opcjonalny.
- Idąc dalej, czy istnieje różnica między sprawdzaniem poprawności a testowaniem w kontekście uczenia maszynowego?
The training set is used to fit the models; the validation set is used to estimate prediction error for model selection; the test set is used for assessment of the generalization error of the final chosen model. Ideally, the test set should be kept in a “vault,” and be brought out only at the end of the data analysis.