W wielu aplikacjach uczenia maszynowego tak zwane metody powiększania danych pozwoliły na zbudowanie lepszych modeli. Załóżmy na przykład zestaw szkoleniowy zawierający zdjęć kotów i psów. Obracając, odbijając, dostosowując kontrast itp. Można wygenerować dodatkowe obrazy z oryginalnych.
W przypadku obrazów powiększanie danych jest stosunkowo proste. Załóżmy jednak (na przykład), że jeden zestaw szkoleniowy zawiera próbek i kilkaset zmiennych ciągłych, które reprezentują różne rzeczy. Powiększanie danych nie wydaje się już tak intuicyjne. Co można zrobić w takim przypadku?