Materiały do ​​nauki o technikach wielu celów?


11

Szukam zasobów (książek, notatek z wykładów itp.) Na temat technik, które mogą obsługiwać dane, które mają wiele celów (np .: trzy zmienne zależne: 2 dyskretne i 1 ciągłe).

Czy ktoś ma jakieś zasoby / wiedzę na ten temat? Wiem, że można do tego wykorzystać sieci neuronowe.

Odpowiedzi:


6

Losowy las poradzi sobie z tym dość dobrze, zobacz Czy losowy las z wieloma wynikami byłby możliwy / praktyczny? lub dokumentację scikit learn . Wydaje mi się, że GBM lub dowolną metodę opartą na drzewach można dostosować w podobny sposób.

Mówiąc bardziej ogólnie, kiedy uruchamiasz dowolny algorytm uczenia minimalizujący wynik, zwykle pracujesz nad zminimalizowaniem który jest jednowymiarowy. Ale możesz określić dowolną funkcję docelową. Jeśli pracujesz nad (dwuwymiarową) prognozą pozycji, będzie dobrym miernikiem.ja(pja-yja)2)ja(y^ja-yja)2)+(x^ja-xja)2)

Jeśli masz dane wyjściowe o mieszanym typie (klasyfikacja i regresja), wówczas określenie funkcji docelowej prawdopodobnie wymagać będzie określenia funkcji docelowej, która przypisuje większą wagę niektórym celom niż innym: jakie skalowanie stosuje się do ciągłych odpowiedzi? Jaką stratę ponosisz w przypadku niewłaściwej klasyfikacji?

Co do dalszej lektury akademickiej,

Wikipedia SVM Structured Learning

Jednocześnie wykorzystując struktury wyników i zadań dla regresji z wieloma wynikami

Metoda wyboru punktu orientacyjnego do prognozowania wielu wyników (dotyczy zmiennych zależnych o dużych wymiarach)


1
Biorąc pod uwagę, że regresja wielu celów ma również modelować relacje między Y, czy nie chciałbyś funkcji straty mierzącej dopasowanie tej relacji?
Max Ghenis

3

Ten artykuł dobrze opisuje obecne metody, dostępne zestawy narzędzi, a także zestawy danych do przetestowania.

Zdarzyło mi się pracować nad problemem komercyjnym wymagającym regresji wielu celów i odkryłem, że zestaw narzędzi Clus ma dobre połączenie wysokiej wydajności i solidności

  • Dokumentacja jest doskonała
  • Zestaw narzędzi zawiera kilka metod klasyfikacji i regresji dla wielu celów
  • Obsługuje także indukcję i grupowanie oparte na regułach.
  • Modele zespołu (Bagging, RandomForest), których użyłem, można łatwo odczytać i zinterpretować.

Niektóre z nowszych metod (po 2012 r.) Zostały zaimplementowane jako rozszerzenie zestawu narzędzi Mulan, oto link Github . Chociaż metody te, takie jak Losowe Kombinacje Celów Liniowych, wykazują lepszą wydajność niż modele złożone, stwierdziłem, że zestaw narzędzi nie jest tak dojrzały jak zestaw Clus i dlatego ich nie użyłem.


Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.