9

Czy jest jakaś prosta zasada, by powiedzieć, czy warto zrobić SOR zamiast Gaussa-Seidela? (i możliwy sposób oszacowania parametru realxation ) $\omega$

Mam na myśli po prostu patrząc na matrycę lub znajomość konkretnego problemu, jaki reprezentuje matryca?

Czytałem odpowiedź na te pytania: Czy są jakieś heurystyki dla optymalizacji metody sukcesywnej nadmiernej relaksacji (SOR)? ale jest to trochę zbyt wyrafinowane. Nie widzę prostej heurystyki, jak oszacować promień widmowy, patrząc tylko na macierz (lub problem, który ona reprezentuje).

Chciałbym coś znacznie prostszego - tylko kilka przykładów macierzy (problemów), dla których SOR zbiegają się szybciej.

Eksperymentowałem z SOR dla macierzy tego króla: gdzie macierzą tożsamości, oraz s są liczbami losowymi z rozkładu unifrom, tak że . Myślałem, że będzie pewna zależność optymalnego od parametrów . $A = I + C + R$ $I$ $C_{ij}=c$ $\forall i,j$ $R_{ij}$ $|R_{ij}|<r$ $\omega$ $c,r$

EDYCJA: Użyłem bardzo małego aby upewnić się, że jest silnie dominujący po przekątnej. ( , dla matrycy o wymiarze 5-10). Powinienem też powiedzieć, że te były prawdziwe i symetryczne. $c,r$ $A$ $|c|<0.1$ $r<2|c|$ $A$

Odkryłem $\omega=1$ jednak, że Gauss-Seidel ( ) jest prawie zawsze najlepszy (?) . Czy to oznacza, że musi istnieć pewna korelacja między s, aby skorzystać z SOR? Czy zrobiłem coś złego? $A_{ij}$

Wiem, że SOR nie jest najskuteczniejszym solwerem (w porównaniu do CG, GMRES ...), ale jest prosty do wdrożenia, sparametryzowania i modyfikacji dla konkretnego problemu. Na pewno dobry do prototypowania.

linear-solver iterative-method heuristics

— Prokop Hapala
źródło

5

Zbieżność klasycznych solwerów iteracyjnych dla układów liniowych jest określona przez promień widmowy macierzy iteracji, . W przypadku ogólnego układu liniowego trudno jest określić optymalny (lub nawet dobry) parametr SOR ze względu na trudność w określeniu promienia widmowego macierzy iteracji. Poniżej zamieściłem wiele dodatkowych szczegółów, w tym przykład prawdziwego problemu, w którym znana jest optymalna waga SOR. $\rho(\mathbf{G})$

Promień widmowy i zbieżność

Promień spektralny jest zdefiniowany jako wartość bezwzględna wartości własnej największej wielkości. Metoda zbiegnie się, jeśli a mniejszy promień widmowy oznacza szybszą zbieżność. SOR działa poprzez zmianę podziału macierzy stosowanego do uzyskania macierzy iteracji w oparciu o wybór parametru ważenia , miejmy nadzieję, że zmniejsza promień widmowy powstałej macierzy iteracji. $\rho<1$ $\omega$

Podział macierzy

W poniższej dyskusji założę, że system do rozwiązania jest podany przez

A x = b,

$\mathbf{A}x=b,$

z iteracją formularza

x^{(k + 1)} = v + G x^{(k)},

$x^{(k+1)}=v+\mathbf{G}x^{(k)},$

gdzie jest wektorem, a liczba iteracji jest oznaczona . $v$ $k$ $x^{(k)}$

SOR przyjmuje średnią ważoną starej iteracji i iteracji Gaussa-Seidela. Metoda Gaussa-Seidela polega na podziale macierzy na formę

A = D + L + U

$\mathbf{A} = \mathbf{D} + \mathbf{L} + \mathbf{U}$

gdzie to przekątna , to dolna trójkątna matryca zawierająca wszystkie elementy ściśle poniżej przekątnej, a to górna trójkątna matryca zawierający wszystkie elementy ściśle nad przekątną. Iteracja Gaussa-Seidela jest następnie podawana przez $\mathbf{D}$ $\mathbf{A}$ $\mathbf{L}$ $\mathbf{A}$ $\mathbf{R}$ $\mathbf{A}$

x^{(k + 1)} = (D + L)^{- 1} b + G_{G - S} x^{(k)}

$x^{(k+1)}=(\mathbf{D}+\mathbf{L})^{-1}b+\mathbf{G}_{\rm G-S}x^{(k)}$

a macierz iteracji to

G_{G - S} = - (D + L)^{- 1} U .

$\mathbf{G}_{\rm G-S}=-(\mathbf{D}+\mathbf{L})^{-1}\mathbf{U}.$

SOR można następnie zapisać jako

x^{(k + 1)} = ω (D + ω L)^{- 1} b + G_{S O R} x^{(k)}

$x^{(k+1)}=\omega(\mathbf{D}+\omega\mathbf{L})^{-1}b+\mathbf{G}_{\rm SOR}x^{(k)}$

gdzie

G_{S O R} = (D + ω L)^{- 1} ((1 - ω) D - ω U) .

$\mathbf{G}_{\rm SOR} = (\mathbf{D}+\omega\mathbf{L})^{-1}((1-\omega)\mathbf{D}-\omega\mathbf{U}).$

Określenie współczynnika zbieżności schematu iteracyjnego sprowadza się naprawdę do ustalenia promienia widmowego tych matryc iteracyjnych. Zasadniczo jest to trudny problem, chyba że wiesz coś konkretnego o strukturze matrycy. Jest bardzo niewiele przykładów, o których wiem, gdzie można obliczyć optymalny współczynnik ważenia. W praktyce musi być ustalana w locie w oparciu o zaobserwowaną (przypuszczalnie) zbieżność działającego algorytmu. To działa w niektórych przypadkach, ale w innych nie. $\omega$

Optymalny SOR

Jeden realistyczny przykład, w którym znany jest optymalny współczynnik wagowy, pojawia się w kontekście rozwiązywania równania Poissona:

\nabla^{2} u = f i n Ω u = g o n \partial Ω

$\nabla^2 u = f~{\rm in}~\Omega\\ u = g~{\rm on}~\partial\Omega$

Dyskretyzacja tego systemu w dziedzinie kwadratu w 2D przy użyciu różnic skończonych drugiego rzędu z równomiernymi odstępami siatki daje w wyniku symetryczną macierz pasmową z 4 na przekątnej, -1 bezpośrednio powyżej i poniżej przekątnej oraz dwa kolejne pasma -1 pewnej odległości od przekątna. Istnieją pewne różnice wynikające z warunków brzegowych, ale taka jest podstawowa struktura. Biorąc pod uwagę tę macierz, możliwy do udowodnienia optymalny wybór współczynnika SOR daje

ω = \frac{2}{1 + \sin (π Δ x / L)}

$\omega = \dfrac{2}{1+\sin(\pi \Delta x/L)}$

gdzie to odstępy między osiami, a to rozmiar domeny. Robiąc to dla prostego przypadku ze znanym rozwiązaniem daje następujący błąd w stosunku do liczby iteracji dla tych dwóch metod: $\Delta x$ $L$

Błąd Gaussa-Seidla i SOR

Jak widać, SOR osiąga precyzję maszyny w około 100 iteracjach, w których Gauss-Seidel jest o około 25 rzędów wielkości gorszy. Jeśli chcesz się pobawić tym przykładem, zamieściłem kod MATLAB, którego użyłem poniżej.

clear all
close all

%number of iterations:
niter = 150;

%number of grid points in each direction
N = 16;
% [x y] = ndgrid(linspace(0,1,N),linspace(0,1,N));
[x y] = ndgrid(linspace(-pi,pi,N),linspace(-pi,pi,N));
dx = x(2,1)-x(1,1);
L = x(N,1)-x(1,1);

%desired solution:
U = sin(x/2).*cos(y);

% Right hand side for the Poisson equation (computed from U to produce the
% desired known solution)
Ix = 2:N-1;
Iy = 2:N-1;
f = zeros(size(U));
f(Ix,Iy) = (-4*U(Ix,Iy)+U(Ix-1,Iy)+U(Ix+1,Iy)+U(Ix,Iy-1)+U(Ix,Iy+1));

figure(1)
clf
contourf(x,y,U,50,'linestyle','none')
title('True solution')

%initial guess (must match boundary conditions)
U0 = U;
U0(Ix,Iy) = rand(N-2);

%Gauss-Seidel iteration:
UGS = U0; EGS = zeros(1,niter);
for iter=1:niter
    for iy=2:N-1
        for ix=2:N-1
            UGS(ix,iy) = -1/4*(f(ix,iy)-UGS(ix-1,iy)-UGS(ix+1,iy)-UGS(ix,iy-1)-UGS(ix,iy+1));
        end
    end

    %error:
    EGS(iter) = sum(sum((U-UGS).^2))/sum(sum(U.^2));
end

figure(2)
clf
contourf(x,y,UGS,50,'linestyle','none')
title(sprintf('Gauss-Seidel approximate solution, iteration %d', iter))
drawnow

%SOR iteration:
USOR = U0; ESOR = zeros(1,niter);
w = 2/(1+sin(pi*dx/L));
for iter=1:niter
    for iy=2:N-1
        for ix=2:N-1
            USOR(ix,iy) = (1-w)*USOR(ix,iy)-w/4*(f(ix,iy)-USOR(ix-1,iy)-USOR(ix+1,iy)-USOR(ix,iy-1)-USOR(ix,iy+1));
        end
    end

    %error:
    ESOR(iter) = sum(sum((U-USOR).^2))/sum(sum(U.^2));
end

figure(4)
clf
contourf(x,y,USOR,50,'linestyle','none')
title(sprintf('Gauss-Seidel approximate solution, iteration %d', iter))
drawnow


figure(5)
clf
semilogy(EGS,'b')
hold on
semilogy(ESOR,'r')
title('L2 relative error')
xlabel('Iteration number')
legend('Gauss-Seidel','SOR','location','southwest')

— Doug Lipiński
źródło

Czy znasz jakieś dobre / dobrze znane techniki, które są używane do obliczania parametru SOR w locie? Słyszałem wcześniej, że w tych technikach stosuje się oszacowania promienia widmowego - czy możesz wyjaśnić, w jaki sposób wykorzystują one promień widmowy, czy zapewnić dobre odniesienie?

— nukeguy

Och, widzę, że jest to rozwiązane w połączonym pytaniu scicomp.stackexchange.com/questions/851/… . Nie przejmuj się moimi pytaniami, ale jeśli masz więcej do dodania, możesz to zrobić.

— nukeguy

@Doug Lipinski Myślałem, że f należy pomnożyć przez dx * dy. Ten czynnik pochodzi z dyskretnej drugiej pochodnej (patrz tutaj na przykład). Btw, kiedy to robię, algorytm nie działa poprawnie. Wiesz dlaczego?

— shamalaia

0

Ta strona rzeczy nie jest tak naprawdę moją specjalnością, ale nie sądzę, że jest to bardzo uczciwy test dla wielu realistycznych aplikacji.

Nie jestem pewien, co ceni uzywasz dla C i R , ale podejrzewam, że pracujesz z bardzo źle uwarunkowanych matryc. (Poniżej znajduje się kod w języku Python pokazujący, że mogą to nie być najbardziej odwracalne macierze).

>>> import numpy
>>> for n in [100, 1000]:
...     for c in [.1, 1, 10]:
...         for r in [.1, 1, 10]:
...             print numpy.linalg.cond(
...                 numpy.eye(n) + 
...                 c * numpy.ones((n, n)) + 
...                 r * numpy.random.random((n, n))
...             )
... 
25.491634739
2034.47889101
2016.33059429
168.220149133
27340.0090644
5532.81258852
1617.33518781
42490.4410689
5326.3865534
6212.01580004
91910.8386417
50543.9269739
24737.6648458
271579.469212
208913.592289
275153.967337
17021788.5576
117365.924601

Jeśli faktycznie trzeba było odwracać macierze tak źle uwarunkowane, a) należy użyć specjalistycznej metody ib) prawdopodobnie należy po prostu znaleźć nowe pole 😉

W przypadku dobrze kondycjonowanych matryc o dowolnym rozmiarze SOR prawdopodobnie będzie szybszy. W przypadku prawdziwych problemów, w których liczy się prędkość, rzadko byłoby używać SOR - po wyrafinowanej stronie jest obecnie znacznie lepiej; powolna, ale niezawodna strona, SOR nie jest najlepszym rozwiązaniem.

— Mikrofon
źródło

cześć, nie mówię, że mój „test” jest uczciwy. Nie powiedziałbym nawet, że to test, to tylko moja naiwna próba zrozumienia, jak SOR i Gauss-Seidel zachowują się eksperymentalnie. Załóżmy, że jestem kompletnym noobem w tej dziedzinie. Kim parametrów, w zakresie , a. Aby upewnić się, że matryca jest silnie ukośna (użyłem mniejszych matryc o wymiarze ~ 10)

0.01 < | c | < 0.1

$0.01<|c|<0.1$

r < 2 | c |

$r<2|c|$

— Prokop Hapala

Chciałem powiedzieć, że zdecydowanie dominuje po przekątnej.

— meawoppl

0

OK, więc dla matryc symetrycznych tego króla:

1 t 0 0 0 0 t t 0 0 
t 1 0 0 0 0 0 0 0 0 
0 0 1 0 0 0 0 t 0 t 
0 0 0 1 0 0 0 0 0 t 
0 0 0 0 1 t 0 0 0 0 
0 0 0 0 t 1 0 t 0 0 
t 0 0 0 0 0 1 0 0 0 
t 0 t 0 0 t 0 1 0 0 
0 0 0 0 0 0 0 0 1 t 
0 0 t t 0 0 0 0 t 1

SOR zbiega się szybciej niż Gaussa-Seidela, jeśli liczba w każdym rzędzie jest mała (znacznie mniejsza niż wymiar A) i jeśli wszystkie są podobne. Używałem wygenerowanych w ten sposób: $t$ $t$ $t$

$t_i = c + random(-r,r)$

Jeśli s różnią się znacznie i są wyśrodkowane wokół 0 ( ), to Gauss-Seidel jest szybszy. Gauss-Seidel jest także szybszy, jeśli każdy rząd jest więcej niż w połowie wypełniony przez . Oznacza to również, że SOR jest lepszy dla bardzo dużych i bardzo rzadkich matryc. $t$ $c=0,r=0.1$ $t$

(To tylko obserwacja cesarska, nic rygorystycznego)

— Prokop Hapala
źródło

Jakieś problemy, w których SOR jest szybszy niż Gaussa-Seidela?

Promień widmowy i zbieżność

Podział macierzy

Optymalny SOR