Ostatnio natknąłem się na artykuł, który proponuje użycie klasyfikatora k-NN w określonym zbiorze danych. Autorzy wykorzystali wszystkie dostępne próbki danych, aby przeprowadzić k-krotną weryfikację krzyżową dla różnych wartości k i zgłosić wyniki walidacji krzyżowej najlepszej konfiguracji hiperparametrów.
Według mojej wiedzy wynik ten jest stronniczy i powinni zachować osobny zestaw testowy, aby uzyskać oszacowanie dokładności próbek nieużywanych do optymalizacji hiperparametrów.
Czy mam rację? Czy możesz podać jakieś referencje (najlepiej artykuły z badań), które opisują to niewłaściwe użycie walidacji krzyżowej?