Metody ponownego próbkowania Careta


20

Korzystam z biblioteki caretw języku R do testowania różnych procedur modelowania.

trainControlObiektu pozwala na określenie metody wielokrotnego pobierania próbek. Te sposoby są opisane w dokumentacji części 2.3 i obejmują: boot, boot632, cv, LOOCV, LGOCV, repeatedcvi oob. Chociaż niektóre z nich można łatwo wywnioskować, nie wszystkie z tych metod są jasno określone.

Jakie są procedury odpowiadające tym metodom ponownego próbkowania?


link do dokumentacji jest uszkodzony. Zamiast tego użyj tego .
vikas,

Odpowiedzi:


20

Ok, oto moja próba:


1
Uważam, że LGOCV losowo dzieli się między zestawem treningowym a zestawem walidacyjnym, powtarzane n razy. Tak więc zamiast zwykłego przypadku dzielenia danych między pociągiem a blokadą (zbuduj model w pociągu i zweryfikuj blokadę) jeden raz, proces ten powtarza się wiele razy.
B_Miner

3
Uważam również, że powtarzane CV to k-krotna walidacja krzyżowa, wykonywana wiele razy.
B_Miner

Trudno uwierzyć, że nie jest to gdzieś udokumentowane.
andrew

4

Na repeatedcvpewno powtarza się 10-krotną walidację krzyżową, zgodnie z prezentacją Maxa Kuhna. Domyślny schemat ponownego próbkowania to bootstrap.

Dobrym plikiem, na który możesz spojrzeć o metodach ponownego próbkowania, jest Modelowanie predykcyjne z R i pakietem karetki ( pdf ). Max przedstawił to w „useR! 2013”.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.