Czytałem o walidacji k-fold i chcę się upewnić, że rozumiem, jak to działa.
Wiem, że w przypadku metody wstrzymania dane są podzielone na trzy zestawy, a zestaw testowy jest używany tylko na samym końcu do oceny wydajności modelu, podczas gdy zestaw sprawdzania poprawności służy do dostrajania hiperparametrów itp.
W metodzie k-fold nadal trzymamy zestaw testowy na samym końcu i używamy tylko pozostałych danych do treningu i dostrajania hiperparametrów, tzn. Dzielimy pozostałe dane na kfold, a następnie używamy średniej dokładności po treningu z każdym foldem (lub jakimkolwiek wskaźnikiem wydajności, który zdecydujemy się dostroić nasze hiperparametry)? Czy też w ogóle nie używamy osobnego zestawu testów i po prostu dzielimy cały zestaw danych na k fałdy (jeśli tak jest, zakładam, że bierzemy pod uwagę średnią dokładność k fałd jako naszą ostateczną dokładność)?