Przeczytałem kilka artykułów na temat inicjalizacji jądra i wiele artykułów wspomina, że używają regulowania L2 jądra (często z ).
Czy ktoś robi coś innego niż inicjowanie błędu systematycznego zerowym i nieregulowanie go?
Dokumenty inicjujące jądro
- Mishkin and Matas: Wszystko czego potrzebujesz to dobry init
- Xavier Glorot i Yoshua Bengio: Zrozumienie trudności w trenowaniu głębokich sieci neuronowych
- On i wsp .: Zagłębiając się w prostowniki: przewyższające wydajność na poziomie ludzkim w klasyfikacji ImageNet