Pytania otagowane jako gradient-descent

2
Czy błąd średniej kwadratowej jest zawsze wypukły w kontekście sieci neuronowych?
Wiele zasobów, o których wspomniałem, wspomina, że ​​MSE jest świetny, ponieważ jest wypukły. Ale nie rozumiem jak, szczególnie w kontekście sieci neuronowych. Powiedzmy, że mamy następujące elementy: XXX: zestaw danych szkoleniowych YYY: cele ΘΘ\Theta: zestaw parametrów modelu fΘfΘf_\Theta (model sieci neuronowej z nieliniowościami) Następnie: MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 Dlaczego …
Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.