Sztuczna inteligencja gradient-descent

Pytania otagowane jako gradient-descent

Czy błąd średniej kwadratowej jest zawsze wypukły w kontekście sieci neuronowych?

Wiele zasobów, o których wspomniałem, wspomina, że MSE jest świetny, ponieważ jest wypukły. Ale nie rozumiem jak, szczególnie w kontekście sieci neuronowych. Powiedzmy, że mamy następujące elementy: XXX: zestaw danych szkoleniowych YYY: cele ΘΘ\Theta: zestaw parametrów modelu fΘfΘf_\Theta (model sieci neuronowej z nieliniowościami) Następnie: MSE(Θ)=(fΘ(X)−Y)2MSE⁡(Θ)=(fΘ(X)−Y)2\operatorname{MSE}(\Theta) = (f_\Theta(X) - Y)^2 Dlaczego …

9 neural-networks math backpropagation gradient-descent