Jestem trochę nowy w analizie danych / uczeniu maszynowym / itp. i czytałem o kilku sposobach łączenia wielu modeli i serii tego samego modelu w celu poprawy prognoz.
Mam wrażenie, że po przeczytaniu kilku artykułów (często interesujących i świetnych z teorii i liter greckich, ale bez kodu i faktycznych przykładów) mam wrażenie, że powinno wyglądać tak:
Biorę model ( knn
, RF
itp.) I otrzymuję listę klasyfikatorów od 0 do 1. Moje pytanie brzmi: jak połączyć każdą z tych list klasyfikatorów? Czy korzystam z tych samych modeli w zestawie treningowym, aby liczba kolumn wchodzących do ostatecznego modelu była taka sama, czy jest jakiś inny sposób?
Byłoby wspaniale, gdyby jakieś sugestie / przykłady zawierały kod R.
UWAGA: Dotyczy to zestawu danych w / 100 tys. Linii w zestawie szkoleniowym i 70 tys. W zestawie testowym i 10 kolumnach.