Większość sieci, które widziałem, ma jedną lub dwie gęste warstwy przed ostatnią warstwą softmax.
- Czy istnieje jakiś zasadny sposób wyboru liczby i wielkości gęstych warstw?
- Czy dwie gęste warstwy są bardziej reprezentatywne niż jedna dla tej samej liczby parametrów?
- Czy należy stosować usuwanie przed każdą gęstą warstwą, czy tylko raz?