Mam prototypową maszynę do produkcji części.
W pierwszym teście maszyna produkuje części a binarny klasyfikator mówi mi, że części d 1 są wadliwe ( d 1 < N 1 , zwykle d 1 / N 1 < 0,01 i N 1 ≈ 10 4 ) oraz N 1 - d 1 części są dobre.
Następnie technik dokonuje zmian w maszynie, aby zmniejszyć liczbę wadliwych części.
W drugim i kolejnym teście zmodyfikowana maszyna wytwarza części a ten sam binarny klasyfikator (nietknięty) mówi mi, że części d 2 są wadliwe, w każdym razie d 2 / N 2 jest dość podobne do d 1 / N 1 .
Technik chciałby wiedzieć, czy jego zmiany są skuteczne.
Zakładając, że klasyfikatory są idealne (jego czułość wynosi 100%, a swoistość wynosi 100%), mogę wykonać test proporcji (z R, po prostu piszę prop.test(c(d1,d2),c(N1,N2))
).
Ale klasyfikator nie jest doskonały, więc jak mogę wziąć pod uwagę czułość i specyficzność, zarówno nieznaną, jak i klasyfikatora, aby właściwie odpowiedzieć technikowi?