Dlaczego warto używać znormalizowanego wyniku Gini zamiast AUC jako oceny?

Konkurs Kaggle'a W prognozie bezpiecznego kierowcy Porto Seguro wykorzystano znormalizowany wynik Gini jako miernik oceny, co zainteresowało mnie przyczynami tego wyboru. Jakie są zalety używania znormalizowanego wyniku Gini zamiast najbardziej typowych wskaźników, takich jak AUC, do oceny?

— xboard
źródło

Witryna Kaggle miała taką odpowiedź: „Istnieje maksymalny możliwy do uzyskania obszar dla„ idealnego ”modelu, ponieważ nie wszystkie pozytywne przykłady pojawiają się natychmiast. Używamy znormalizowanego współczynnika Gini, dzieląc współczynnik Gini twojego modelu przez współczynnik Gini idealnego modelu. ” ale nie jest już dostępny. webcache.googleusercontent.com/…

— Sextus Empiricus

Więc Gini jest po prostu w innej skali. A może auc i gini są stosowane do różnych krzywych? To nie jest dla mnie jasne, jako nie-ekspert w uczeniu maszynowym. Pytanie nie jest do końca jasne.

— Sextus Empiricus,

g i n i = 2 \times A U C - 1

$gini = 2 \times AUC -1$

— Miguel
źródło

Poza tym użycie współczynnika gini ustawia wydajność losowego klasyfikatora na wynik 0 ... normalizacja „poprawia” drugi koniec skali i sprawia, że wynik doskonałego klasyfikatora jest równy 1, a nie maksymalny osiągalny AUC <1. Poprawa jest względna tylko w zależności od tego, czy uważasz, że bardziej intuicyjna skala jest dobra, czy nie. Chociaż poza tą łatwiejszą interpretacją można argumentować, że (normalizacja) poprawia również uogólnienie i porównanie różnych zestawów danych.

— Sextus Empiricus,

Dlaczego maksymalna osiągalna AUC powinna być mniejsza niż 1, a także nie widzę, jak Gini ustawia ją na 1?

— rep_ho,

Zależy to od rodzaju krzywej, którą obliczają współczynnik gini. Być może używają czegoś innego niż krzywa ROC (której maksymalne AUC rzeczywiście wynosiłoby 1). Biorąc pod uwagę słowa na stronie kaggle, wydaje się prawdopodobne, że maksymalne AUC nie wynosi 1:> „Następnie przechodzimy od lewej do prawej, pytając:„ W

— Sextus Empiricus,

przykład: bayesserver.com/docs/charts/lift-chart

— Sextus Empiricus