Załóżmy, że chcę dokonać klasyfikacji binarnej (coś należy do klasy A lub klasy B). Istnieje kilka możliwości, aby to zrobić w warstwie wyjściowej sieci neuronowej:
Użyj 1 węzła wyjściowego. Wyjście 0 (<0,5) jest uważane za klasę A, a 1 (> = 0,5) jest uważane za klasę B (w przypadku sigmoidu)
Użyj 2 węzłów wyjściowych. Dane wejściowe należą do klasy węzła o najwyższej wartości / prawdopodobieństwie (argmax).
Czy są jakieś artykuły, w których (również) o tym dyskutuje? Jakie są konkretne słowa kluczowe do wyszukania?
To pytanie zostało już zadane wcześniej na tej stronie, np. Zobacz ten link bez prawdziwych odpowiedzi. Muszę dokonać wyboru (praca magisterska), więc chcę uzyskać wgląd w zalety / wady / ograniczenia każdego rozwiązania.