Mam 12 pozytywnych zestawów treningowych (komórki rakowe leczone lekami z każdym z 12 różnych mechanizmów działania). Dla każdego z tych pozytywnych zestawów treningowych chciałbym wytrenować maszynę wektora nośnego, aby odróżniała ją od ujemnego zestawu o równej wielkości próbkowanego z eksperymentu. Każdy zestaw ma od 1000 do 6000 komórek, a dla każdej komórki jest 476 cech (cechy obrazu), każdy skalowany liniowo do [0, 1].
Używam LIBSVM i jądra Gaussa RGB. Korzystając z pięciokrotnej walidacji krzyżowej, przeprowadziłem wyszukiwanie siatki dla log₂ C ∈ [-5, 15] i log₂ ɣ ∈ [-15, 3]. Wyniki są następujące:
Byłem rozczarowany, że nie ma jednego zestawu parametrów, które dałyby wysoką dokładność dla wszystkich 12 problemów klasyfikacyjnych. Byłem również zaskoczony, że siatki na ogół nie pokazują regionu o wysokiej dokładności otoczonego mniejszymi dokładnościami. Czy to tylko oznacza, że muszę rozszerzyć przestrzeń parametrów wyszukiwania, czy też wyszukiwanie siatki wskazuje, że coś innego jest nie tak?