Przeczytałem artykuł Alexandru Niculescu-Mizila i Richa Caruany „ Uzyskiwanie skalibrowanych prawdopodobieństw od wzmocnienia ” i dyskusję w tym wątku. Jednak nadal mam problemy ze zrozumieniem i wdrożeniem logistyki lub skalowania Platta, aby skalibrować moc wyjściową mojego wieloklasowego klasyfikatora podwyższającego (łagodne przyspieszanie z kikutami decyzyjnymi).
Jestem nieco zaznajomiony z uogólnionymi modelami liniowymi i myślę, że rozumiem, w jaki sposób logistyka i metody kalibracji Platta działają w przypadku binarnym, ale nie jestem pewien, czy wiem, jak rozszerzyć metodę opisaną w artykule na przypadek wielu klas.
Klasyfikator, którego używam, generuje następujące dane:
- = liczba głosów oddanych przez klasyfikatora dla klasy j dla próbki i, która jest klasyfikowana
- = Szacowana klasa
W tym momencie mam następujące pytania:
P1: Czy muszę używać logiki wielomianowej, aby oszacować prawdopodobieństwo? lub czy nadal mogę to zrobić za pomocą regresji logistycznej (np. w trybie 1-vs-all )?
P2: Jak powinienem zdefiniować pośrednie zmienne docelowe (np. Jak w skalowaniu Platta) dla przypadku wielu klas?
P3: Rozumiem, że może to być wiele pytań, ale czy ktoś byłby skłonny naszkicować pseudo-kod tego problemu? (na bardziej praktycznym poziomie interesuje mnie rozwiązanie w Matlabie).