Co to jest mieszanie danych?


15

Termin ten pojawia się często w wątkach związanych z metodą .

Czy łączenie określonej metody w eksploracji danych i uczeniu statystycznym? Nie mogę uzyskać odpowiedniego wyniku z Google.

Wydaje się, że łączenie miesza wyniki z wielu modeli i daje lepszy wynik. Czy jest jakiś zasób, który pomaga mi dowiedzieć się więcej na ten temat?

Odpowiedzi:


10

http://www.cs.cornell.edu/~caruana/ctp/ct.papers/caruana.icml04.icdm06long.pdf Niektóre dokumenty, które pomogą ci lepiej zrozumieć, czym jest mieszanie. Myślę, że możesz także wyszukiwać w zespole / uczyć się, a także układać w stosy.

Twoje ogólne zrozumienie „mieszania wyników z wielu modeli i uzyskiwania lepszych wyników” jest jednak poprawne.


Link ten został również wzięty gdzieś na forum kaggle. Zapisałem tylko link do pliku pdf, ale nie dyskusję ...
King

12

Wzmocnienie (jak wspomniano w połączonej dyskusji) to metoda, która łączy zestaw algorytmów, aby uzyskać wynik lepszy niż w przypadku dowolnego pojedynczego algorytmu. Na przykład losowe lasy to metoda łączenia różnych drzew klasyfikacyjnych dla algorytmu klasyfikacyjnego. Takie podejście jest formalnie nazywane uśrednianiem zespołu (chociaż algorytm zwykle stosuje zasadę większości). Mieszanie wydaje się słowem, które niektórzy używają do opisania udoskonalonego podejścia do klasyfikacji.


Czy można to nazwać mieszaniem, jeśli zastąpię drzewa klasyfikacji w normalnym modelu Adaboost innym zestawem algorytmów?
TomHall,

Cześć, Michael. Twoja odpowiedź jest naprawdę pomocna, ale szkoda, że ​​jestem nowy w statystykach i nie mam wystarczającej reputacji, aby głosować na twoją odpowiedź.
TomHall,

1
Pamiętaj więc, aby to zrobić po uzyskaniu kilku punktów powtórzeń.
Michael R. Chernick

0

W branży mieszanie danych nie dotyczy modeli, ale przetwarzania wstępnego : to kiedy dane są scalane, pochodzą z różnych źródeł, takich jak baza danych i inne dane z plików CSV.

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.