Próbuję rozwiązać zadanie regresji. Dowiedziałem się, że 3 modele działają dobrze dla różnych podzbiorów danych: LassoLARS, SVR i Gradient Tree Boosting. Zauważyłem, że kiedy robię prognozy na podstawie tych wszystkich 3 modeli, a następnie tworzę tabelę „rzeczywistych wyników” i wyników moich 3 modeli, widzę, że za każdym razem przynajmniej jeden z modeli jest naprawdę bliski rzeczywistej mocy wyjściowej, chociaż 2 inne może być stosunkowo daleko.
Kiedy obliczam minimalny możliwy błąd (jeśli we wszystkich przykładach testowych przewiduję „najlepszy” predyktor), otrzymuję błąd, który jest znacznie mniejszy niż błąd dowolnego modelu. Pomyślałem więc o próbie połączenia prognoz z tych 3 różnych modeli w coś w rodzaju zestawu. Pytanie brzmi, jak to zrobić poprawnie? Wszystkie moje 3 modele są budowane i dostrajane przy użyciu scikit-learn. Czy zapewnia to jakąś metodę, która mogłaby zostać użyta do spakowania modeli w zespół? Problem polega na tym, że nie chcę tylko uśredniać prognoz ze wszystkich trzech modeli, chcę to zrobić z ważeniem, gdzie ważenie powinno być określane na podstawie właściwości konkretnego przykładu.
Nawet jeśli scikit-learn nie zapewnia takiej funkcjonalności, byłoby miło, gdyby ktoś wiedział, jak rozwiązać ten problem - obliczyć wagę każdego modelu dla każdego przykładu w danych. Myślę, że może to być zrobione przez osobny regresor zbudowany na wszystkich tych 3 modelach, który spróbuje uzyskać optymalne wagi dla każdego z 3 modeli, ale nie jestem pewien, czy jest to najlepszy sposób na zrobienie tego.