Wyjaśnię to na kilka różnych sposobów, ponieważ pomogło mi to zrozumieć.
Weźmy konkretny przykład. Robisz test na chorobę na grupie ludzi. Teraz zdefiniujmy niektóre terminy. W odniesieniu do każdego z poniższych mam na myśli osobę, która została przetestowana:
Prawdziwie pozytywny (TP) : Ma chorobę, którą zidentyfikowano jako chorującą
Fałszywie dodatni (FP) : Nie ma choroby, zidentyfikowanej jako choroba
Prawdziwie negatywny (TN) : Nie ma choroby, zidentyfikowanej jako brak choroby
Fałszywie ujemny (FN) : Ma chorobę zidentyfikowaną jako nie chorująca
Wizualnie jest to zazwyczaj pokazane przy użyciu macierzy pomieszania :
Fałszywie dodatnich (FPR) jest liczba osób, które nie mają tej choroby, ale są zidentyfikowane jako posiadające choroby (wszystkie fps), podzieloną przez łączną liczbę osób, które nie mają choroby (zawiera wszystkie FPS i TNS) .
faP.R = F.P.faP.+ TN.
Wskaźnik fałszywych odkryć (FDR) to liczba osób, które nie chorują, ale są zidentyfikowane jako chore (wszystkie FP), podzielona przez całkowitą liczbę osób, u których stwierdzono chorobę (obejmuje wszystkie FP i TP ).
faD R = F.P.faP.+ TP.
Różnica polega na mianowniku, tj. Do czego porównujesz liczbę fałszywych trafień?
FPR mówi ci odsetek wszystkich osób, które nie mają tej choroby, którzy zostaną zidentyfikowane jako posiadające choroby.
FDR mówi ci odsetek wszystkich osób zidentyfikowanych jako mający chorobę, którzy nie mają choroby.
Oba są zatem użytecznymi, odrębnymi miernikami niepowodzenia. W zależności od sytuacji i proporcji TP, FP, TN i FN, możesz być bardziej zainteresowany jednym z nich.
Dodajmy teraz do tego kilka liczb. Zmierzyłeś 100 osób na tę chorobę i otrzymałeś:
Prawdziwie pozytywne (TP) : 12
Fałszywie pozytywne (FP) : 4
Prawdziwe negatywy (TN) : 76
Fałszywe negatywy (FN) : 8
Aby to pokazać za pomocą macierzy zamieszania:
Następnie,
faP.R = F.P.faP.+ TN.= 44 + 76= 480= 0,05 = 5 %
faD R = F.P.faP.+ TP.= 44 + 12= 416= 0,25 = 25 %
Innymi słowy,
FPR informuje, że 5% osób z osób, które nie chorowały, zostało zidentyfikowanych jako cierpiące na tę chorobę. FDR informuje, że 25% osób zidentyfikowanych jako cierpiące na tę chorobę faktycznie nie miało tej choroby.
EDYCJA na podstawie komentarza @ amoeba (także liczby w powyższym przykładzie):
n
[Uwaga dodatkowa: Wikipedia wskazuje, że chociaż FPR jest matematycznie równoważny ze wskaźnikiem błędów typu I, jest uważany za odrębny pod względem koncepcyjnym, ponieważ jeden jest zazwyczaj ustalany a priori, a drugi jest zwykle używany do pomiaru wydajności testu później. To ważne, ale nie będę o tym tutaj rozmawiać].
I dla nieco większej kompletności:
Oczywiście FPR i FDR nie są jedynymi istotnymi wskaźnikami, które można obliczyć za pomocą czterech wielkości w macierzy pomieszania. Spośród wielu możliwych wskaźników, które mogą być przydatne w różnych kontekstach , dwa stosunkowo często spotykane:
Rzeczywisty wskaźnik dodatni (TPR) , znany również jako wrażliwość , to odsetek osób z chorobą, które zostały zidentyfikowane jako cierpiące na tę chorobę.
T.P.R = TP.T.P.+ F.N.
Rzeczywisty wskaźnik ujemny (ang. True Negative Rate, TNR) , znany również jako specyficzność , to odsetek osób, które nie chorują, które zidentyfikowano jako nie chorujące.
T.N.R = TN.T.N.+ F.P.