Czy istnieje literatura wymieniająca cechy algorytmów, które pozwalają na ich wyjaśnienie?
Jedyną znaną mi literaturą jest najnowsza praca Ribero, Singha i Guestrina. Najpierw określają wyjaśnialność pojedynczej prognozy:
Przez „wyjaśnienie prognozy” rozumiemy prezentację tekstowych lub wizualnych artefaktów, które zapewniają jakościowe zrozumienie związku między komponentami instancji (np. Słowa w tekście, łatki na obrazie) a prognozą modelu.
Autorzy dalej wyjaśniają, co to oznacza dla bardziej konkretnych przykładów, a następnie wykorzystują to pojęcie do zdefiniowania wyjaśnialności modelu. Ich celem jest próba sztucznego dodania wyjaśnienia sztucznie do nieprzezroczystych modeli, zamiast porównywania wyjaśnienia istniejących metod. Artykuł może być pomocny, ponieważ próbuje wprowadzić bardziej precyzyjną terminologię wokół pojęcia „wyjaśnialności”.
Czy są powszechnie akceptowane modele uczenia maszynowego jako dobry kompromis między nimi?
Zgadzam się z @Winter, że siatka elastyczna dla regresji (nie tylko logistycznej) może być postrzegana jako przykład dobrego kompromisu między dokładnością prognozowania a wyjaśnialnością.
W przypadku innego rodzaju dziedziny aplikacji (szeregów czasowych) inna klasa metod zapewnia również dobry kompromis: Bayesian Structural Time Series Modeling. Dziedziczy on wyjaśnialność z klasycznego modelowania szeregów czasowych i pewną elastyczność z podejścia bayesowskiego. Podobnie jak w przypadku regresji logistycznej, wyjaśnienia pomagają równania regresji zastosowane do modelowania. Zobacz ten artykuł, aby uzyskać dobre zastosowanie w marketingu i dalsze referencje.
W związku z wyżej wspomnianym kontekstem bayesowskim możesz również przyjrzeć się probabilistycznym modelom graficznym. Ich wyjaśnialność nie opiera się na równaniach regresji, ale na graficznych sposobach modelowania; zobacz „Probabilistyczne modele graficzne: zasady i techniki” Kollera i Friedmana, aby uzyskać doskonały przegląd.
Nie jestem jednak pewien, czy możemy odwoływać się do powyższych metod bayesowskich jako „ogólnie przyjętego dobrego kompromisu”. Mogą nie być do tego wystarczająco znane, zwłaszcza w porównaniu z przykładem elastycznej siatki.