Mamy zestaw próbek biologicznych, których uzyskanie było dość drogie. Przekazujemy te próbki przez serię testów w celu wygenerowania danych, które są wykorzystywane do budowy modelu predykcyjnego. W tym celu podzieliliśmy próbki na zestawy szkoleniowe (70%) i testowe (30%). Z powodzeniem stworzyliśmy model i zastosowaliśmy go na zestawie testowym, aby odkryć, że wydajność była „niższa niż optymalna”. Eksperymentaliści chcą teraz ulepszyć testy biologiczne, aby stworzyć lepszy model. Pod warunkiem, że nie możemy uzyskać nowych próbek, czy sugerujesz nam ponowne przetasowanie próbek w celu utworzenia nowych zestawów szkoleniowych i walidacyjnych lub trzymanie się pierwotnego podziału. (Nie mamy żadnych wskazówek, że podział był problematyczny).