Często widzę ludzi mówiących o walidacji krzyżowej 5x2 jako szczególnym przypadku walidacji krzyżowej zagnieżdżonej .
Zakładam, że pierwsza liczba (tutaj: 5) odnosi się do liczby fałd w wewnętrznej pętli, a druga liczba (tutaj: 2) odnosi się do liczby fałd w zewnętrznej pętli? Czym zatem różni się to od „tradycyjnego” podejścia do wyboru i oceny modelu? Mam na myśli „tradycyjny”
- podziel zestaw danych na osobne szkolenie (np. 80%) i zestaw testowy
- użyj k-krotnej walidacji krzyżowej (np. k = 10) do strojenia hiperparametrów i wyboru modelu w zestawie treningowym
- ocenić wydajność uogólnienia wybranego modelu za pomocą zestawu testowego
Czy 5x2 nie jest dokładnie takie samo, z wyjątkiem tego, że zestaw testowy i treningowy mają taki sam rozmiar, jeśli k = 2?