Pytanie jest dość niejasne, więc założę, że chcesz wybrać odpowiednią miarę wydajności, aby porównać różne modele. Aby uzyskać dobry przegląd kluczowych różnic między krzywymi ROC i PR, zapoznaj się z następującym artykułem: Związek między precyzją- przywołaniem a krzywymi ROC autorstwa Davisa i Goadricha .
Cytując Davisa i Goadricha:
Jednak w przypadku bardzo wypaczonych zestawów danych krzywe Precision-Recall (PR) dają bardziej pouczający obraz wydajności algorytmu.
Krzywe ROC wykreślają wykres FPR vs TPR. Mówiąc dokładniej:
Krzywe PR wykreślają precyzję w porównaniu do przywołania (FPR), a dokładniej:
recall=TP
FPR=FPFP+TN,TPR=TPTP+FN.
recall=TPTP+FN=TPR,precision=TPTP+FP
Na precyzję ma bezpośredni wpływ równowaga klasy (im), ponieważ wpływa na , podczas gdy TPR zależy tylko od wyników dodatnich. Dlatego krzywe ROC nie wychwytują takich efektów.FP
Krzywe dokładności i przywołania lepiej podkreślają różnice między modelami dla wysoce niezrównoważonych zestawów danych. Jeśli chcesz porównać różne modele w niezrównoważonych ustawieniach, obszar pod krzywą PR będzie prawdopodobnie wykazywał większe różnice niż obszar pod krzywą ROC.
To powiedziawszy, krzywe ROC są znacznie częstsze (nawet jeśli są mniej odpowiednie). W zależności od odbiorców krzywe ROC mogą być lingua franca, więc korzystanie z nich jest prawdopodobnie bezpieczniejszym wyborem. Jeśli jeden model całkowicie dominuje nad innym w przestrzeni PR (np. Zawsze ma wyższą precyzję w całym zakresie przywołania), będzie również dominował w przestrzeni ROC. Jeśli krzywe przecinają się w jednej przestrzeni, to również krzyżują się w drugiej. Innymi słowy, główne wnioski będą podobne bez względu na zastosowaną krzywą.
Bezwstydna reklama . Jako dodatkowy przykład możesz rzucić okiem na jeden z moich artykułów w którym raportuję zarówno krzywe ROC, jak i PR w niezrównoważonym otoczeniu. Rycina 3 zawiera krzywe ROC i PR dla identycznych modeli, wyraźnie pokazując różnicę między nimi. Aby porównać obszar pod PR i obszar pod ROC, możesz porównać tabele 1-2 (AUPR) i tabele 3-4 (AUROC), gdzie widać, że AUPR pokazuje znacznie większe różnice między poszczególnymi modelami niż AUROC. To jeszcze raz podkreśla przydatność krzywych PR.