Znalazłem potencjalnie sprzeczne definicje dla statystyki walidacji krzyżowej (CV) i statystyki uogólnionej walidacji krzyżowej (GCV) związanej z modelem liniowym (z normalnym, homoscedastycznym wektorem błędu \ boldsymbol \ varepsilon ).ε
Z jednej strony Golub, Heath i Wahba definiują oszacowanie GCV jako (s. 216)
minimalizator podany przez
gdzie
Z drugiej strony Efron definiuje to samo pojęcie, co (s. 24), ale przypisuje wprowadzenie tego pojęcia Cravenowi i Wahbie, gdzie jego definicja (s. 377) jest zasadniczo taka sama jak wyżej wymieniona definicja Goluba, Heatha i Wahby.
Czy to oznacza, że minimalizuje ?
Podobnie Golub, Heath i Wahba definiują oszacowanie CV (s. 217) jako minimalizator
gdzie jest wartością szacunkową
z z th punkt danych pominięte.
Autorzy przypisują wprowadzenie oszacowania CV (zwanego także oszacowaniem PRESS) Allenowi („PRESS Allena”, ibid.). Jednak w pracy Allena oszacowanie PRESS jest zdefiniowane (s. 126) jako (w artykule Efrona jest to zdefiniowane jako (s. 24)).
Znów, czy to oznacza, że minimalizuje ?
Allen, David M. Związek między wyborem zmiennych i analizowaniem danych a metodą prognozowania. Technometrics, tom. 16, nr 1 (luty 1974 r.), S. 125–127
Craven, Peter and Wahba, Grace. Wygładzanie zaszumionych danych za pomocą funkcji splajnu. Numerische Mathematik 31, (1979), s. 377-403
Efron, Bradley. Jak stronniczy jest pozorny poziom błędu regresji logistycznej? Raport techniczny nr 232. Katedra Statystyki, Uniwersytet Stanforda (kwiecień 1985)
Golub, Gene H., Heath and Grace Wahba. Uogólniona walidacja krzyżowa jako metoda wyboru dobrego parametru kalenicy. Technometrics, tom. 21, nr 2 (maj 1979 r.), S. 215–223