Bardziej produktywnym pytaniem może być „dlaczego nie wykorzystano go w klasycznych statystykach, których się nauczyłem?”
W zależności od poziomu (poziomów) nauczania, treść kursu (i dostępny czas) może wynikać z kombinacji różnych czynników. Często pomija się ważne tematy, ponieważ z tego czy innego powodu należy uczyć innych materiałów z nadzieją, że zostaną one omówione w późniejszych tematach.
Przynajmniej w niektórych aspektach pojęcie to było od dawna używane przez różne osoby. To było bardziej powszechne w niektórych obszarach niż w innych. Wiele zastosowań statystyki nie ma przewidywania lub wyboru modelu jako głównego komponentu (lub w niektórych przypadkach nawet w ogóle), w takim przypadku użycie próbek wstrzymania może być mniej krytyczne niż wtedy, gdy głównym punktem jest przewidywanie. Prawdopodobnie powinien był zostać bardziej rozpowszechniony na wcześniejszym etapie w niektórych istotnych aplikacjach niż miał, ale to nie to samo, co bycie nieznanym.
Jeśli spojrzysz na obszary, które koncentrują się na predykcji, pojęcie oceny modelu poprzez przewidywanie danych, których nie wykorzystałeś do oszacowania modelu, z pewnością było w pobliżu (choć nie uniwersalne). Z pewnością robiłem to za pomocą modelowania szeregów czasowych, które robiłem w latach 80. XX wieku, na przykład tam, gdzie przewidywanie wyników najnowszych danych poza próbą było szczególnie ważne.
Pojęcie pominięcia przynajmniej niektórych danych zastosowano na przykład w regresji (usunięte resztki, PRASA, podnośnik itp.), A także w analizie wartości odstających.
Niektóre z tych pomysłów jeszcze wcześniej sporo dawały. Stone (1974) [1] odnosi się do artykułów na temat walidacji krzyżowej (ze słowem w tytule) z lat 50. i 60. Być może nawet bliżej twoich zamiarów, wspomina użycie przez Simona (1971) terminów „próbka konstrukcyjna” i „próbka walidacyjna” - ale zwraca również uwagę, że „Larson (1931) zastosował losowy podział próby w wielokrotności edukacyjnej - badanie regresji ”.
Tematy takie jak walidacja krzyżowa oraz wykorzystanie statystyk opartych na prognozach itd. Stały się znacznie częstsze w literaturze statystycznej na przykład w latach 70. i 80., ale wiele podstawowych pomysłów pojawiło się już od dłuższego czasu, nawet następnie.
[1]: Stone, M., (1974)
„Cross-Validatory Choice and Assessment of Statistics Predictions,”
Journal of Royal Statistics Society. Seria B (metodologiczna) , tom. 36, nr 2, s. 111–147