To pytanie dotyczy oceny wyników granicznych w wielowymiarowym kwestionariuszu przesiewowym w celu przewidzenia binarnego punktu końcowego w obecności skorelowanych skal.
Zapytano mnie o zainteresowanie kontrolowaniem powiązanych wyników przy opracowywaniu punktów odcięcia dla każdego wymiaru skali pomiarowej (cechy osobowości), które mogłyby być wykorzystane do badań alkoholizmu. Oznacza to, że w tym konkretnym przypadku dana osoba nie była zainteresowana dostosowywaniem zewnętrznych zmiennych towarzyszących (predyktorów) - co prowadzi do (częściowego) obszaru pod krzywą ROC skorygowaną współzmiennie, np. (1-2) - ale zasadniczo na innych wynikach z tego samego kwestionariusza, ponieważ korelują ze sobą (np. „impulsywność” z „szukaniem wrażeń”). Sprowadza się to do zbudowania GLM, który zawiera po lewej stronie interesujący wynik (dla którego szukamy granicy) i inny wynik obliczony na podstawie tego samego kwestionariusza, podczas gdy po prawej stronie wynikiem może być stan picia.
Aby wyjaśnić (na żądanie @robin), załóżmy, że mamy wyniki, powiedzmy (np. Lęk, impulsywność, neurotyzm, poszukiwanie wrażeń) i chcemy znaleźć wartość (tj. „Przypadek dodatni” , w przeciwnym razie „przypadek ujemny”) dla każdego z nich. Zwykle dostosowujemy się do innych czynników ryzyka, takich jak płeć lub wiek, przy opracowywaniu takiego punktu odcięcia (za pomocą analizy krzywej ROC). A co z dostosowaniem impulsywności (IMP) do płci, wieku i poszukiwania wrażeń (SS), ponieważ wiadomo, że SS koreluje z IMP? Innymi słowy, mielibyśmy wartość odcięcia dla IMP, w której usunięto by wpływ wieku, płci i poziomu lęku.
Oprócz stwierdzenia, że granica musi pozostać tak prosta, jak to możliwe, moja odpowiedź brzmiała:
Jeśli chodzi o zmienne towarzyszące, zaleciłbym oszacowanie AUC z korektą i bez korekty, aby sprawdzić, czy wydajność predykcyjna wzrośnie. Tutaj, twoje zmienne towarzyszące są jedynie innymi wynikami dodatkowymi zdefiniowanymi z tego samego przyrządu pomiarowego i nigdy nie spotkałem się z taką sytuacją (zwykle dostosowuję się do znanych czynników ryzyka, takich jak Wiek lub Płeć). [...] Ponadto, ponieważ interesują Cię kwestie prognostyczne (tj. Skuteczność badania przesiewowego kwestionariusza), możesz być również zainteresowany oszacowaniem dodatniej wartości predykcyjnej (PPV, prawdopodobieństwo pacjentów z pozytywnymi wynikami testu, którzy są prawidłowo sklasyfikowani), pod warunkiem jesteś w stanie klasyfikować przedmioty jako „pozytywne” lub „negatywne” w zależności od ich wyników w kwestionariuszu. Uwaga jednak
Czy lepiej rozumiesz tę konkretną sytuację, w miarę możliwości z linkami do odpowiednich dokumentów?
Bibliografia
- Janes, H and Pepe, MS (2008). Dostosowanie do zmiennych towarzyszących w badaniach markerów diagnostycznych, badań przesiewowych lub prognostycznych: stara koncepcja w nowym otoczeniu . American Journal of Epidemiology , 168 (1): 89–97.
- Janes, H and Pepe, MS (2008). Uwzględnianie zmiennych towarzyszących w analizie ROC . UW Biostatistics Working Paper Series , Paper 322.