Jaka jest różnica między problemem wieloklasowym a problemem wielopłaszczyznowym?
Jaka jest różnica między problemem wieloklasowym a problemem wielopłaszczyznowym?
Odpowiedzi:
Podejrzewam, że różnica polega na tym, że w problemach z wieloma klasami klasy wzajemnie się wykluczają, podczas gdy w przypadku problemów z wieloma etykietami każda etykieta reprezentuje inne zadanie klasyfikacji, ale zadania są w jakiś sposób powiązane (więc zaletą jest ich wspólne rozwiązywanie, a nie osobno ). Na przykład, w słynnym kraby leptograspus zbiorze istnieją przykłady mężczyzn i kobiety w dwóch formach barwnych krabów. Możesz podejść do tego jako problemu wieloklasowego z czterema klasami (męsko-niebieski, żeńsko-niebieski, męsko-pomarańczowy, żeńsko-pomarańczowy) lub jako problem z wieloma etykietami, gdzie jedna etykieta to mężczyzna / kobieta, a druga niebieski /Pomarańczowy. Zasadniczo w przypadku problemów z wieloma etykietami wzór może należeć do więcej niż jednej klasy.
Klasyfikacja wieloklasowa oznacza zadanie klasyfikacyjne obejmujące więcej niż dwie klasy; np. sklasyfikuj zestaw zdjęć owoców, którymi mogą być pomarańcze, jabłka lub gruszki. Klasyfikacja wieloklasowa zakłada, że każda próbka jest przypisana do jednej i tylko jednej etykiety: owocem może być jabłko lub gruszka, ale nie oba jednocześnie.
Klasyfikacja wielopłaszczyznowa przypisuje do każdej próbki zestaw etykiet docelowych. Można to uznać za przewidywanie właściwości punktu danych, które nie wykluczają się wzajemnie, np. Tematy istotne dla dokumentu. Tekst może dotyczyć dowolnej religii, polityki, finansów lub edukacji w tym samym czasie lub żadnej z nich.
Zaczerpnięte z http://scikit-learn.org/stable/modules/multiclass.html
Aby uzupełnić inne odpowiedzi, oto kilka liczb. Jeden wiersz = oczekiwany wynik dla jednej próbki.
Jedna kolumna = jedna klasa (kodowanie na gorąco)
Jedna kolumna = jedna klasa
Widzisz to:
Na marginesie, nic nie stoi na przeszkodzie, abyś miał problem z klasyfikacją wielu wyjść i wieloklasów , np .:
Problem wieloklasowy ma przypisanie instancji do jednego ze skończonego, wzajemnie wykluczającego się zbioru klas. Jak w podanym już przykładzie kraba (z @Dikran): męski-niebieski, żeński-niebieski, męski-pomarańczowy, żeński-pomarańczowy. Każda z nich jest wykluczona z innych i razem są kompleksowe.
Jedną z form problemu wielu etykiet jest podzielenie ich na dwie etykiety: płeć i kolor; gdzie płeć może być mężczyzną lub kobietą, a kolor może być niebieski lub pomarańczowy. Pamiętaj jednak, że jest to szczególny przypadek problemu dotyczącego wielu etykiet, ponieważ każda instancja otrzyma każdą etykietę (to znaczy każdy krab ma zarówno płeć, jak i kolor).
Problemy z wieloma etykietami obejmują również inne przypadki, które pozwalają przypisać zmienną liczbę etykiet do każdej instancji. Na przykład artykuł w gazecie lub serwisie przewodowym może być przypisany do kategorii AKTUALNOŚCI, POLITYKA, SPORT, MEDYCYNA itp. Jedna opowieść o ważnym wydarzeniu sportowym otrzymałaby etykietę SPORTS; podczas gdy inne, związane z napięciami politycznymi ujawnionymi przez dane wydarzenie sportowe, mogą zyskać zarówno etykiety SPORTS, jak i POLITYKA. Tam, gdzie jestem, w USA wyniki Superbowl są oznaczone zarówno SPORTS, jak i NEWS ze względu na społeczny wpływ tego wydarzenia.
Zauważ, że ta forma etykietowania, ze zmienną liczbą etykiet, może zostać przekształcona w formę podobną do przykładu z krabami; z wyjątkiem tego, że każda etykieta jest traktowana jako LABEL-X lub nie-LABEL-X. Ale nie wszystkie metody wymagają tego przekształcenia.
I jeszcze jedna różnica polega na tym, że problem wielu etykiet wymaga od modelu uczenia się korelacji między różnymi klasami, ale w problemach wieloklasowych różne klasy są od siebie niezależne.