Eksperyment z wykrywaniem sygnału zwykle przedstawia obserwatorowi (lub systemowi diagnostycznemu) sygnał lub sygnał, a obserwator jest proszony o zgłoszenie, czy uważają, że prezentowany element jest sygnałem czy nie. Takie eksperymenty dają dane wypełniające macierz 2x2:
Teoria wykrywania sygnału reprezentuje takie dane, jak scenariusz, w którym decyzja o „sygnale / braku sygnału” opiera się na kontinuum sygnału, na którym próby sygnału mają na ogół wyższą wartość niż próby braku sygnału, a obserwator po prostu wybiera wartość kryterium, powyżej której zgłasza „sygnał”:
Na powyższym diagramie rozkłady zielony i czerwony reprezentują odpowiednio rozkłady „sygnałowy” i „niesygnałowy”, a szara linia reprezentuje wybrane kryterium danego obserwatora. Po prawej stronie szarej linii obszar pod zieloną krzywą reprezentuje trafienia, a obszar pod czerwoną krzywą reprezentuje fałszywe alarmy; po lewej stronie szarej linii obszar pod zieloną krzywą reprezentuje chybienie, a obszar pod czerwoną krzywą reprezentuje prawidłowe odrzucenia.
Jak można sobie wyobrazić, zgodnie z tym modelem odsetek odpowiedzi, które wpadają do każdej komórki powyższej tabeli 2x2 jest określony przez:
- Względny odsetek prób pobranych z rozkładów zielonego i czerwonego (stawka podstawowa)
- Kryterium wybrane przez obserwatora
- Separacja między rozkładami
- Wariancja każdej dystrybucji
- Wszelkie odstępstwa od równości wariancji między rozkładami (równość wariancji przedstawiono powyżej)
- Kształt każdego rozkładu (oba są powyżej Gaussa)
Często wpływ nr 5 i nr 6 można ocenić tylko poprzez skłonienie obserwatora do podjęcia decyzji na wielu różnych poziomach kryteriów, więc na razie to zignorujemy. Dodatkowo, # 3 i # 4 mają sens tylko względem siebie (np. Jak duży jest rozdział w stosunku do zmienności rozkładów?), Podsumowany miarą „dyskryminacji” (znanej również jako d '). Zatem teoria wykrywania sygnału zakazuje oszacowania dwóch właściwości na podstawie danych wykrywania sygnału: kryterium i dyskryminacji.
Jednak często zauważyłem, że raporty badawcze (szczególnie z dziedziny medycyny) nie stosują ram wykrywania sygnału i zamiast tego próbują analizować takie wielkości, jak „dodatnia wartość predykcyjna”, „ujemna wartość predykcyjna”, „czułość” i „swoistość ”, z których wszystkie reprezentują różne wartości krańcowe z powyższej tabeli 2x2 ( patrz opracowanie tutaj ).
Jaką użyteczność zapewniają te marginalne właściwości? Moją skłonnością jest całkowite zignorowanie ich, ponieważ dezorientują teoretycznie niezależne wpływy kryteriów i dyskryminacji, ale być może po prostu brakuje mi wyobraźni, aby rozważyć ich korzyści.