Próbuję stworzyć detektor obiektów, które występują bardzo rzadko (na zdjęciach), planując użyć binarnego klasyfikatora CNN stosowanego w przesuwanym / zmienianym oknie. Skonstruowałem zbalansowane zestawy treningów i testów dodatnich i ujemnych 1: 1 (czy w takim przypadku dobrze jest to zrobić btw?), A klasyfikator ma się dobrze na zestawie testowym pod względem dokładności. Teraz chcę kontrolować przywołanie / precyzję mojego klasyfikatora, aby na przykład nie oznaczał on zbyt wiele większości przypadków wystąpienia klasy.
Oczywistym (jak dla mnie) rozwiązaniem jest użycie tej samej straty logistycznej, która jest teraz stosowana, ale błędy wagi typu I i typu II różnią się poprzez pomnożenie straty w jednym z dwóch przypadków na pewnej stałej, którą można dostroić. Czy to jest poprawne?
PS Z drugiej strony jest to równoważne z ważeniem niektórych próbek treningowych bardziej niż innych. Myślę, że dodanie tylko jednej klasy pozwoli osiągnąć to samo.