Próbuję zrozumieć, jak działa metoda optymalizacji oparta na sprzężeniu dla optymalizacji ograniczonej przez PDE. W szczególności staram się zrozumieć, dlaczego metoda łączenia jest bardziej wydajna w przypadku problemów, w których liczba zmiennych projektowych jest duża, ale „liczba równań jest niewielka”.
Co rozumiem:
Rozważ następujący problem optymalizacji ograniczonej przez PDE:
gdzie jest (wystarczająco ciągłą) funkcją celu wektorowych zmiennych projektowych i wektora zmiennych polowych nieznanych które zależą od zmiennych projektowych, a jest resztową postacią PDE.
Oczywiście możemy pierwsze odmiany I i R jako
Wprowadzając wektor mnożników Lagrange'a , zmienność funkcji celu można zapisać jako
Zmieniając warunki, możemy napisać:
Zatem jeśli jesteśmy w stanie rozwiązać dla takie, że
Następnie gradient oceniano tylko pod względem zmiennych projektowych .
Dlatego algorytm optymalizacji oparty na sprzężeniu zapętlałby następujące kroki:
- Biorąc pod uwagę aktualne zmienne projektowe
- Rozwiąż dla zmiennych pola (z PDE)
- Rozwiąż mnożniki Lagrange'a (z równania sąsiadującego)
- Oblicz gradienty
- Zaktualizuj zmienne projektowe
Moje pytanie
W jaki sposób ta przylegająca „sztuczka” poprawia koszt optymalizacji na iterację w przypadku, gdy liczba zmiennych projektowych jest duża? Słyszałem, że koszt oceny gradientu dla metody łączenia jest „niezależny” od liczby zmiennych projektowych. Ale jak dokładnie to prawda?
Jestem pewien, że coś bardzo oczywistego przeoczyłem.