Chciałbym przetestować mój wyszkolony model na niezrównoważonym zbiorze danych. Czy są dostępne algorytmy do generowania danych syntetycznych ze zbilansowanego zbioru danych (spam / nie spam)?
Chciałbym przetestować mój wyszkolony model na niezrównoważonym zbiorze danych. Czy są dostępne algorytmy do generowania danych syntetycznych ze zbilansowanego zbioru danych (spam / nie spam)?
Odpowiedzi:
Wypróbuj SMOTE , który jest algorytmem używanym do nadmiernego próbkowania. Tworzy próbki syntetyczne z klasy, którą chcesz przesadzić z próbkami.
Możesz użyć tego do stworzenia dowolnej liczby potrzebnych próbek.