Biorąc pod uwagę zestaw danych z wynikami binarnymi i pewną macierzą predykcyjną , standardowy model regresji logistycznej szacuje współczynniki które maksymalizują prawdopodobieństwo dwumianowe. Gdy ma pełną pozycję, jest unikalny; gdy nie ma doskonałej separacji, jest skończona.
Czy ten model maksymalnego prawdopodobieństwa maksymalizuje AUC ROC (aka statystyka), czy też istnieje jakiś współczynnik szacunkowy który pozwoli uzyskać wyższą AUC ROC? Jeśli prawdą jest, że MLE niekoniecznie maksymalizuje AUC ROC, to innym sposobem spojrzenia na to pytanie jest: „Czy istnieje alternatywa dla maksymalizacji prawdopodobieństwa, która zawsze maksymalizuje AOC ROC regresji logistycznej?”
Zakładam, że modele są inaczej takie same: nie dodajemy ani nie usuwamy predyktorów w , ani w żaden inny sposób nie zmieniamy specyfikacji modelu, i zakładam, że modele maksymalizujące prawdopodobieństwo i maksymalizujące AUC używają tej samej funkcji łączenia.