Układanie modeli w stos z karetką


21

Często carettrenuję kilka różnych modeli predykcyjnych przy użyciu w R. Wyszkolę je wszystkie na tych samych fałdach sprawdzania krzyżowego, używając caret::: createFolds, a następnie wybieram najlepszy model na podstawie błędu zweryfikowanego krzyżowo.

Jednak mediana prognoz z kilku modeli często przewyższa najlepszy pojedynczy model w niezależnym zestawie testów. Zastanawiam się nad napisaniem niektórych funkcji do układania w stosy / zestawiania modeli karetki, które były trenowane z tymi samymi fałdami walidacji krzyżowej, na przykład poprzez przyjmowanie mediany przewidywań z każdego modelu przy każdym fałdzie lub przez trenowanie „meta-modelu”.

Oczywiście może to wymagać zewnętrznej pętli weryfikacji krzyżowej. Czy ktoś wie o istniejących pakietach / otwartym kodzie źródłowym do zestawiania modeli Caret (i ewentualnie krzyżowej weryfikacji tych zestawów)?

Odpowiedzi:


19

Wygląda na to, że Max Kuhn faktycznie zaczął pracować nad pakietem do łączenia modeli caret , ale nie miał jeszcze czasu, aby go ukończyć. Właśnie tego szukałem. Mam nadzieję, że projekt zostanie ukończony pewnego dnia!

edycja: Napisałem własny pakiet, aby to zrobić: caretEnsemble


1
Doskonała praca nad tym pakietem!
mikeycgto


1

Nie jestem do końca pewien, czego szukasz, ale to może pomóc: http://www.jstatsoft.org/v28/i05/paper

To jak używać wielu modeli w karetce. Część, która może Cię zainteresować, to sekcja 5 na stronie. 13


To, czego szukam, to pakiet, który jako dane wejściowe pobierałby listę obiektów karetki, a następnie generowałby medianę, średnią lub średnią ważoną ich prognoz. Bardziej zaawansowane funkcje mogą obejmować optymalizację wag poprzez sprawdzanie poprawności zagnieżdżonej.
Zach.
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.