Czy dane normalizujące (mające zerową średnią i odchylenie standardowe jedności) przed powtórzeniem k-krotnej walidacji krzyżowej mają jakieś negatywne konsekwencje, takie jak nadmierne dopasowanie?
Uwaga: dotyczy to sytuacji, gdy # skrzynki> łączna liczba funkcji
Przekształcam niektóre moje dane za pomocą transformacji dziennika, a następnie normalizuję wszystkie dane jak wyżej. Następnie dokonuję wyboru funkcji. Następnie stosuję wybrane cechy i znormalizowane dane do powtarzanej 10-krotnej walidacji krzyżowej, aby spróbować oszacować uogólnioną wydajność klasyfikatora i obawiam się, że wykorzystanie wszystkich danych do normalizacji może nie być odpowiednie. Czy powinienem znormalizować dane testowe dla każdego krotnie przy użyciu danych normalizujących uzyskanych z danych treningowych dla tego krotnie?
Wszelkie opinie otrzymane z wdzięcznością! Przepraszamy, jeśli to pytanie wydaje się oczywiste.
Edycja: Podczas testowania tego (zgodnie z poniższymi sugestiami) stwierdziłem, że normalizacja przed CV nie wpłynęła znacząco na wydajność w porównaniu z normalizacją w CV.