Spadek gradientu jest iteracyjnym algorytmem optymalizacji pierwszego rzędu. Aby znaleźć lokalne minimum funkcji za pomocą opadania gradientu, należy wykonać kroki proporcjonalne do ujemnego gradientu (lub przybliżonego gradientu) funkcji w bieżącym punkcie. Dla stochastycznego spadku gradientu istnieje również znacznik [sgd].