W przypadku wykrywania powszechnym sposobem ustalenia, czy propozycja jednego obiektu była poprawna, jest Skrzyżowanie przez Unię (IoU, IU). Pobiera zestaw proponowanych pikseli obiektowych i zestaw rzeczywistych pikseli obiektowych B i oblicza:
Zwykle IoU> 0,5 oznacza, że był to hit, w przeciwnym razie byłby to błąd. Dla każdej klasy można obliczyć
- Prawdziwie dodatni ( ): propozycja została przygotowana dla klasy c i faktycznie był obiekt klasy c
- Fałszywie dodatni ( ): zaproponowano klasę c , ale nie ma obiektu klasy c
- Średnia dokładność dla klasy : # T P ( c )
MAP (średnia średnia precyzja) =
Jeśli ktoś chce lepszych propozycji, zwiększa IoU z 0,5 do wyższej wartości (do 1,0, co byłoby idealne). Można to określić za pomocą mAP @ p, gdzie to IoU.
Ale co oznacza mAP@[.5:.95]
(jak stwierdzono w tym artykule )?
[.5:.95]
część odnosi się do zakresu wartości IoU, ale jak ten zakres jest oceniany w pojedynczy mAP, nie wiedziałbym.