Jeśli chodzi o zewnętrzne iteracje, SQP powinien wygrać, ponieważ zawiera informacje o drugiej pochodnej, podczas gdy ulepszone metody lagranżańskie, takie jak ADMM, nie.
Należy jednak pamiętać, że każda iteracja tych metod wymaga rozwiązania systemu liniowego, więc aby dokonać rzetelnego porównania, należy wziąć pod uwagę, jak łatwe jest rozwiązanie tych systemów.
W przypadku rozszerzonych metod Lagrange'a (naprzemiennych) każda iteracja, którą rozwiązujesz,
(ATA+ρI)x=b,
gdzie
A jest operatorem forward wprost z funkcji celu, która jest znana i zwykle łatwiejsza w obsłudze lub warunku wstępnym, oraz
ρto parametr kary. (np. masz problem
minx||Ax−b||2 z zastrzeżeniem pewnych uregulowań i ograniczeń).
W przypadku metod SQP rozwiązujesz coś w rodzaju
gdzie jest Hessem (lub jego przybliżeniem), który jest zwykle dostępny tylko domyślnie pod względem działania na wektory, a jest gradientem. Hesjan zawiera nie tylko , ale także kombinację innych macierzy i odwrotności macierzy pochodzących z linearyzacji ograniczeń i regularyzacji.
Hx=g,
HgA
Wstępne przygotowanie Hesjan jest dość trudnym przedsięwzięciem i jest znacznie mniej zbadane niż wstępne przygotowanie problemów. Standardową metodą jest przybliżenie odwrotności Hesji za pomocą L-BFGS, ale ma to ograniczoną skuteczność, gdy odwrotność Hesji ma wysoką rangę. Inną popularną metodą jest przybliżenie Hesji jako sumy macierzy niskiej rangi plus macierzy łatwej do odwrócenia, ale ma to również ograniczoną skuteczność w przypadku trudnych problemów. Inne popularne techniki szacowania Hesji oparte są na rzadkich przybliżeniach, ale problemy z ciągłością często mają Hesów, którzy mają słabe przybliżenia.