Statystyka walidacji krzyżowej (CV) i ogólne statystyki walidacji krzyżowej (GCV)


23

Znalazłem potencjalnie sprzeczne definicje dla statystyki walidacji krzyżowej (CV) i statystyki uogólnionej walidacji krzyżowej (GCV) związanej z modelem liniowym (z normalnym, homoscedastycznym wektorem błędu \ boldsymbol \ varepsilon ).εY=Xβ+εε

Z jednej strony Golub, Heath i Wahba definiują oszacowanie GCV λ^ jako (s. 216)

minimalizator V(λ) podany przez

V(λ)=1n(IA(λ))y2(1ntr(IA(λ)))2
gdzie A(λ)=X(XTX+nλI)1XT

Z drugiej strony Efron definiuje to samo pojęcie, co V(0) (s. 24), ale przypisuje wprowadzenie tego pojęcia Cravenowi i Wahbie, gdzie jego definicja (s. 377) jest zasadniczo taka sama jak wyżej wymieniona definicja Goluba, Heatha i Wahby.

Czy to oznacza, że 0 minimalizuje V(λ) ?

Podobnie Golub, Heath i Wahba definiują oszacowanie CV λ (s. 217) jako minimalizator

P(λ)=1nk=1n([Xβ(k)(λ)]kyk)2

gdzie β(k)(λ) jest wartością szacunkową

β^(λ)=(XTX+nλI)1XTy

z β z k th punkt danych yi pominięte.

Autorzy przypisują wprowadzenie oszacowania CV (zwanego także oszacowaniem PRESS) Allenowi („PRESS Allena”, ibid.). Jednak w pracy Allena oszacowanie PRESS jest zdefiniowane (s. 126) jako nP(0) (w artykule Efrona jest to zdefiniowane jako P(0) (s. 24)).

Znów, czy to oznacza, że 0 minimalizuje P(λ) ?


  1. Allen, David M. Związek między wyborem zmiennych i analizowaniem danych a metodą prognozowania. Technometrics, tom. 16, nr 1 (luty 1974 r.), S. 125–127

  2. Craven, Peter and Wahba, Grace. Wygładzanie zaszumionych danych za pomocą funkcji splajnu. Numerische Mathematik 31, (1979), s. 377-403

  3. Efron, Bradley. Jak stronniczy jest pozorny poziom błędu regresji logistycznej? Raport techniczny nr 232. Katedra Statystyki, Uniwersytet Stanforda (kwiecień 1985)

  4. Golub, Gene H., Heath and Grace Wahba. Uogólniona walidacja krzyżowa jako metoda wyboru dobrego parametru kalenicy. Technometrics, tom. 21, nr 2 (maj 1979 r.), S. 215–223


7
Czy zapomniałeś wspomnieć, że będzie to wyposażone w regresję grzbietu i nie tylko kwadraty? Byłem całkowicie zdezorientowany tym, czym był dopóki nie zobaczyłem tytułów papieru na doleλ
shadowtalker

1
Usuń Uogólnioną Walidację Krzyżową w tytule i dodaj Regresję Ridge'a w tytule. Oto domyślne wartości GridSearchCV () dla RidgeCV ():
HoofarLotusX

Odpowiedzi:


2

Uważam, że komentarze wskazują na odpowiedź, ale nie mówią wprost. Więc będę tępy.

Cytowana tutaj formuła V jest specyficzna dla liniowej regresji kalenicy. Nie twierdzą, że jest to to samo, co PRESS, twierdzą, że jest to niezmienna rotacja wersja PRESS. Część „niezmienna rotacja” sprawia, że ​​jest to uogólnione.

Artykuł Efrona dotyczy regresji logistycznej dostosowanej do tego kontekstu. Jeśli chcesz zobaczyć tłumaczenie matematyczne między tymi dwoma kontekstami, odpowiednią książką do przeczytania są: Elements of Statistics Learning, 2ed, autorstwa Hastie, Tibshirani i Freedman. Oferują tę książkę bezpłatnie, online: https://web.stanford.edu/~hastie/Papers/ESLII.pdf . Kolejną przydatną lekturą na temat GCV są Uogólnione modele addytywne autorstwa Simona Wooda. Jego leczenie ogólnie integruje GCV z zastosowaniami w regresji i regresji logistycznej.

Jeśli spojrzysz na książkę ESL, str. 244, zobaczysz w zasadzie tę samą symbolikę. Odnoszą się do tego dużego produktu matrycowego, który macie jako Matryca Smoothera (powiedziałbym, że jest to matryca Hat lub bliski kuzyn). Opisują Smoother jako mapowanie od doSyy^

y^=Sy

S może być użyte do obliczenia pominięcia jednej wartości CV, jednej dla każdego wiersza w danych. Dla modeli liniowych The matryca odgrywa rolę matrycy kapelusz w diagnostyce regresji. Mówią jednak, że może to być trudne obliczeniowo lub niepotrzebne, aby to rozwiązać, a podejście GCV jest nieco bardziej ogólną wersją tego samego pomysłu.S

Oferują formułę przybliżenia GCV:

GCV(f^)=1Ni=1N[yif^(xi)1trace(S)/N]2

W wielu modelach jest to bardzo podobne zachowanie do AIC. efektywna ilość parametrów.traceS

nλ kawałek cytujesz jest bardziej ogólnie śladem . O ile rozumiem, w abstrakcyjnej wersji GCV jest przybliżoną wersją pomijania jednej krzyżówki, ale w niektórych przypadkach (uważam, że regresja grzbietu) jest dokładna. To główny punkt w pracy Goluba.S

Powodzenia, odpisz, jeśli dowiesz się więcej.


Dzięki. Zadałem pytanie ponad 5 lat temu i od tego czasu zapomniałem większość tego materiału, więc nie mogę ocenić twojej odpowiedzi, aby stwierdzić, czy jest dobra (która wydaje się być) czy zła, i z tego powodu Ja też nie mogę tego zaakceptować. Ale dziękuję za opublikowanie. Mamy nadzieję, że przyda się innym osobom, które mogą natknąć się na tę stronę.
Evan Aad
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.