Uczę się klasyfikacji SVM i napotykam problem. Nie jestem pewien, czy ten dylemat ma na to terminologię.
Załóżmy, że chcielibyśmy sklasyfikować pacjenta według SVM na podstawie próbek zdrowych osób (obu płci) i osób z rakiem wątroby (obu płci). Jeśli oznaczymy osoby zdrowe jako próbki klasy 1, a osoby z rakiem jako klasy 2, możemy wyszkolić binarną maszynę SVM i uzyskać klasyfikator 1, aby przewidzieć każdego nowego pacjenta. Teraz wyobraź sobie inny scenariusz. Załóżmy, że najpierw dzielimy wszystkie próbki według płci przed klasyfikacją SVM. Dla każdej płci nadal przypisujemy zdrowych pacjentów do pacjentów z rakiem do 2 klas i trenujemy binarną maszynę SVM, aby uzyskać klasyfikator 2 i klasyfikator 3 odpowiednio dla próbek kobiet i mężczyzn. Pytanie brzmi, czy jest nowa pacjentka, którego klasyfikatora, 1 lub 2, należy użyć, aby uzyskać dokładniejsze prognozy? Oto dylemat moich argumentów
(1) Gdy liczba próbek jest duża, prognoza powinna być dokładniejsza. W oparciu o ten argument klasyfikator 1 wydaje się dobrym wyborem.
(2) Jeśli jednak najpierw podzielimy próbki na grupy żeńskie i męskie, klasyfikator 2 wydaje się lepszym wyborem, ponieważ nowy pacjent (nieznana próbka testowa) jest kobietą.
Czy tego rodzaju dylemat ma terminologię, czy też ktoś zna jakieś dodatkowe informacje lub jak rozwiązać taki problem? Nie jestem nawet pewien, czy jest to uzasadnione pytanie i z góry przepraszam za naiwne pytanie. Dzięki