Przeprasza za niewłaściwe użycie terminów technicznych. Pracuję nad projektem segmentacji semantycznej za pośrednictwem splotowych sieci neuronowych (CNN); próbuje zaimplementować architekturę typu Enkoder-Dekoder, dlatego wyjście ma ten sam rozmiar co wejście.
Jak projektujesz etykiety? Jaką funkcję utraty należy zastosować? Zwłaszcza w sytuacji dużej nierównowagi klas (ale stosunek między klasami jest zmienny w zależności od obrazu).
Problem dotyczy dwóch klas (przedmiotów zainteresowania i tła). Używam Keras z backendem tensorflow.
Do tej pory zajmowałem się projektowaniem oczekiwanych wyników o takich samych wymiarach jak obrazy wejściowe, stosując etykietowanie pikselowe. Ostatnia warstwa modelu ma albo aktywację softmax (dla 2 klas), albo aktywację sigmoidalną (aby wyrazić prawdopodobieństwo, że piksele należą do klasy obiektów). Mam problem z zaprojektowaniem odpowiedniej funkcji celu dla takiego zadania typu:
function(y_pred,y_true)
,
w porozumieniu z Keras .
Proszę starać się być konkretnym w odniesieniu do wymiarów zaangażowanych tensorów (wejście / wyjście modelu). Wszelkie uwagi i sugestie są mile widziane. Dziękuję Ci !