Zawody Kaggle określają końcowe rankingi na podstawie ustalonego zestawu testów.
Wyciągnięty zestaw testowy jest próbką; może nie być reprezentatywny dla modelowanej populacji. Ponieważ każde zgłoszenie jest jak hipoteza, algorytm, który wygrał konkurencję, może po prostu przypadkiem dopasować zestaw testowy lepiej niż inne. Innymi słowy, gdyby wybrano inny zestaw testów i powtórzono konkurs, czy rankingi pozostaną takie same?
Dla korporacji sponsorującej nie ma to tak naprawdę znaczenia (prawdopodobnie 20 najlepszych zgłoszeń poprawiłoby ich poziom bazowy). Chociaż, jak na ironię, mogą skończyć na modelu o pierwszej pozycji, który jest gorszy niż w pierwszej piątce. Ale dla uczestników konkursu wydaje się, że Kaggle jest ostatecznie grą losową - szczęście nie jest potrzebne, aby natknąć się na właściwe rozwiązanie, należy natknąć się na tę, która pasuje do zestawu testowego!
Czy można zmienić konkurencję, aby zwyciężyły wszystkie najlepsze zespoły, których nie można statystycznie wyróżnić? Czy w tej grupie mógłby wygrać najbardziej oszczędny lub obliczeniowo tani model?