Table Of ContentFORSCHUNGSBERICHTE DES LANDES NORDRHEIN-WESTFALEN
Nr. 1291
Herausgegeben
im Auftrage des Ministerpräsidenten Dr. Franz Meyers
von Staatssekretär Professor Dr. h. c. Dr. E. h. Leo Brandt
DK 518.12
Dr. rer. nat. Gerhard Schrăder
Rheinisch-WestJălisches Institut
fur 1n strumentclle Mathematik Bonn (IIM)
Dber clie Konvergenz einiger Jacobi-Verfahren
zur Bestimmung cler Eigenwerte symmetrischer Matrizen
SPRINGER FACHMEDIEN WIESBADEN GMBH 1964
ISBN 978-3-322-97936-0 ISBN 978-3-322-98498-2 (eBook)
DOI 10.1007/978-3-322-98498-2
Verlags-Nr.011291
© 1964 Springer Fachmedien Wiesbaden
Urspriinglich erschienen bei Westdeutscher Verlag, K5ln und Op1aden 1964
Gesamtherstellung: Westdeutscher Verlag •
lnhalt
Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1. Das Jacobi-Verfahren ....................................... ..... 8
2. Konvergente Jacobi-Verfahren .......... .................. ...... .. 12
3. Konvergenzbeweis für zyklische Jacobi-Verfahren ................... 16
4. Zur Konvergenz von Zahlenfolgen ................................ 23
5. Allgemeine Aussagen bei symmetrischen Matrizen ................... 28
6. Spezielle Aussagen für einen Schritt der Jacobi-Verfahren ............ 37
7. Die Konvergenz der J acobi-Verfahren bei beliebiger Eigenwertverteilung 41
8. Beispiele........................................................ 48
9. Tabellen, Literaturverzeichnis ................... " ............... , 52
5
Einleitung
Im folgenden solI das Konvergenzverhalten der wichtigsten Jacobi-Verfahren zur
Bestimmung der Eigenwerte symmetrischer Matrizen der Ordnung n (n ~ 2)
untersucht werden. Behandelt werden das klassische Verfahren, die zyklischen
Verfahren und die zyklischen Schwellenwertverfahren (cyclic methods with
thresholds). Für eine gro13e Anzahl zyklischer Verfahren wird ein neuer Konver
genzbeweis gebracht, der im FalIe einfacher Eigenwerte sowie in gewissen Fällen
auch bei Vorhandensein doppelter Eigenwerte quadratische Konvergenz liefert,
wobei gleichzeitig die von A. Schönhage [8] angegebenen Abschätzungskon
stanten verbessert werden. Auf einem anderen Wege werden genauere qualitative
Aussagen über die Güte der Konvergenz bei allen 3 behandelten V orgehensweisen
im FalIe einfacher Eigenwerte abgeleitet, und die Ergebnisse von P. Henrici [2]
wesentIich verbessert. Für das klassische und die zyklischen Schwellenwertverfah
ren wird dieser Weg unter Anwendung eines Hilfssatzes, der über die Lage der
Maximalelemente au13erhalb der Hauptdiagonale bei symmetrischen Matrizen
Auskunft gibt, Aussagen über die Konvergenz bei beliebigem Spektrum ermög
lichen. Dabei wird sich zeigen, daB im allgemeinen um so bessere Konvergenz
herrscht, j'e mehr Eigenwerte übereinstimmen. Der Einfachheit halber werden
nur symmetrische Matrizen behandelt. Durch geeignete Modifikationen lassen
sich die Ergebnisse ohne weiteres auf hermetische Matrizen übertragen.
Zur Bezeichnungsweise: Matrizen werden durch groBe lateiriische Buchstaben,
reelIe Zahlen durch kleine lateinische oder griechische Buchstaben bezeichnet.
Falls kleine lateinische Buchstaben Vektoren bedeuten sollen, wird an der betreffen
den Stelle ausdrücklich darauf hingewiesen.
7
1. Das ]acobi-Verfahren
V orgelegt sei die symmetrische Matrix A der Ordnung n, deren n Eigenwerte
bestimmt werden sollen. Dazu wird eine Folge von symmetrischen Matrizen der
Ordnung n
(1.1)
konstruiert, in der die Matrizen Ak rekursiv definiert sind durch
(k=O, 1,2, ... ). (1.2)
Dabei ist Uk eine Orthogonalmatrix, d. h. U~ = U~ \ die sich von der Einheits
matrix E nur in einer zweidimensionalen Untermatrix unterscheidet. Eine Ortho
gonalmatrix der Ordnung 2 hat allgemein die Form
- sin cp),
(1.3)
cos cp
wobei für den Winkel cp die Einschrankung - n < cp ~ n angenommen werden
kann. Damit läBt sich über die Definition der Matrizen Uk = (u;J» genauer
sagen: Für jedes k existiert ein Paar von Indizes (i,) mit 1 ~ i <) ~ n sowie
ein Winkel ([!k, so daB mit dem Kronecker-Symbol Opq gilt
U(k) = U(k) = cos mk, (1.4.1)
ii ii -r
U(ikj ) = - uUiic ) = - sin m-r k , (1.4.2)
u(k) = 0 sonst . (1.4.3)
pq pq
Wir wollen sagen, daB die Matrix Uk, die den Übergang von Ak zu Ak + 1 bewirkt,
die k -te Rotation von A = A 0 definiert mit dem Rotationswinkel CPk. Irgend
einen Satz von Regeln zur Auswahl der Rotationsmatrizen Uk nennen wir ein
J aco bi-Verfahren.
Falls unter den gegebenen Regeln
limAk=D
(1.5)
k --HIJ
gilt, wobei D eine Diagonalmatrix sein solI, heiBt das Jacobi-Verfahren konver
gent. Da sich die Eigenwerte von Ak beim Übergang zu Ak + 1 nicht ändern,
enthält die Hauptdiagonale von D dann die Eigenwerte von A in irgendeiner
Reihenfolge.
8
Die Elemente a~/ 1) von Ak +1 ergeben sich aus den Elementen a~~ von Ak mit
(1.2) und (1.4.1) bis (1.4.3) wie folgt:
= .!. + + .!. +
ai(jH 1) 2 (a(ik! ) ari1k ») 2 (a(iki) - aCjkj ») cos 2 fTf lk arikj ) sin 2 fTf lk , (1 • 6 • 1)
=.!. + .!.
a1(1H 1) 2 (a(iki) ariki» ) - 2 (a(iki) - arikj» ) cos 2 fTf lk - arikj ) sin 2 fTf lk , (1 • 6 • 2)
a(k+l)=a(k) (163)
pp pp' ••
= - .!. +
a(ikj + 1) 2 (a(ikj) - ariki» ) sin 2 mT k ariki ) cos 2 fTf lk , (1 • 6 • 4)
a~k+ 1) =' a~k) cos mk +a(k) sin mk (1.6.5)
'p 'p T ip T'
+
a(k+ 1) = - ik) sin fflk ark) cos mk (1.6.6)
jp lp T jp T'
a(Hl) =a(k) (1.6.7)
pq pq
mit p und q verschieden von i und j.
C. G. J. Jacobi [1] schlug bereits 1846 folgenden Satz von Regeln zur Bestim
mung des Indexpaares nk = (i, J) sowie des Rotationswinkels qJk in der k-ten
< <
Rotationsmatrix vor. Man wähle i undj mit 1 i <j n so, daB
(1.7)
und
(1.8)
gilt, d. h. die Transformationsmatrix Uk wird so bestimmt, daB das Element (bzw.
eines der Elemente) maximalen Betrages auBerhalb der Hauptdiagonale nach der
Rotation verschwindet. Für qJk folgt daraus wegen (1.6.4) die Gleichung
(1.9)
Um Eindeutigkeit in der Wahl des Winkels qJk zu erreichen, solI zusätzlich
--n< <n- (1.10)
4 qJk 4
gefordert werden. Falls für das durch (1.7) definierte Indexpaar (i,j) a;~) = 0 gilt,
ist Ak gleich der gesuchten Diagonalmatrix D.
Die Vorgehensweise nach den Regeln (1.2), (1.7), (1.8) und (1.10) wollen wir
im folgenden als »klassisches Jacobi-Verfahren« bezeichnen.
Eine Matrix der Ordnung n hat oberhalb der Hauptdiagonale
v=n(n-l)
(1.11)
2
9
Elemente. Bei jedem Schritt des klassischen ]acobi-Verfahrens sind also v Zahlen
zu prüfen, urn das Maximaielement zu finden. Vergleicht man damit die Anzahl
+
der arithmetischen Operationen pro Schritt, so sind hier 2 n 3 Additionen,
4 n - 3 Multiplikationen, 2 Divisionen und 2 Quadratwurzelbestimmungen durch
zuführen. Berechnet man zusätzlich noch das Matrizenprodukt U = U 0 • UI· ... ,
die so entstehende Matrix U enthält als Gesamttransformationsmatrix in den
Spalten die normierten Eigenvektoren von A, so kommen weitere 2 n Addi
tionen und 4 n Multiplikationen pro Schritt hinzu. In beiden FäUen ist die Anzahl
der arithmetischen Operationen proportional zur Ordnung n der Matrix, während
die Anzahl der Vergleiche pro Schritt proportional zum Quadrat der Ordnung
von A ist.
In den letzten Jahren sind daher, spezieU in Verbindung mit der Entwicklung
elektronischer Rechenanlagen, Regeln zur Bestimmung der Rotationsindexpaare
nk vorgeschlagen worden, bei denen der Gesamtaufwand pro Schritt nur noch
proportional n ist.
Die wichtigsten dieser Regeln definieren die sogenannten »zyklischen Jacobi
Verfahren« (Gregory, [3]). Hier wird jedes der v Elemente oberhalb der Haupt
diagonale innerhalb eines Zyklus von v Rotationen genau einmal annulliert, und
zwar stets in der gleichen Reihenfolge. Es gilt also
(1.12)
Vorzugsweise 2 Vorgehensweisen bieten sich hier an, nämlich das zeilenweise
Vorgehen mit der Indexpaarauswahl (wir bezeichnen der Deutlichkeit halber das
Indexpaar der k-ten Rotation hier mit ik,jk)
(ik - 1,jk -1 + 1) für ik -1 < n
+ +
_ 1( ik - 1 1, ik - 1 2) für ik - 1 < n - 1 ,jk - 1 = n (1.13)
nk - (1 , 2) fu"r" "Ik - 1 = n - 1 ,jk" - 1 = n
und für k=O
sowie das spaltenweise V orgehen mit der Indexpaarauswahl
für ik - 1 < jk - 1 - 1
für ik - 1 = j k - 1 - 1 ,jk -1 < n
(1.14)
für ik - 1 = n - 1 ,jk - 1 = n
und für k=O.
Durch die Regeln (1.13) bzw. (1.14) und (1.2), (1.8) und (1.10) sind damit zwei
zyklische J acobi-Verfahren gegeben.
Die gleichen Vorschriften wie bei den zyklischen Verfahren werden auch bei den
»zyklischen ]acobi-Verfahren mit SchweUenwerten« benutzt. Nur (1.8) wird
ersetzt durch
{a i~+ 1) ==; 0 faUs I ai~) I > f}z,
(1.15)
gJk = 0, also Uk = E sonst .
10
Dabei bilden die {Jz (/=0,1,2, ... ) eine monotone Nullfolge positiver Zahlen mit
unendlich vielen von Null verschiedenen Elementen.
Wenn für alle a~~ die Ungleichung I a~~ I < {)z erfüllt ist, wird {)z durch {)z + 1
ersetzt. Die einzelnen Elemente oberhalb der Hauptdiagonale werden also in
einer festen zyklischen Reihenfolge mit den Schwellenwerten {)z verglichen und
nur dann annulliert, wenn sie betragsmäBig gröBer oder gleich {)z sind. Sind sie
kleiner, erfolgt keine Rotation (siehe [4]).
Wir wollen hier die zyklischen Schwellenwertverfahren mit der üblichen speziellen
Schwellenwertwahl
({)o > 0, 0 < 'YJ < 1,1= 1,2, ...) (1.16)
betrachten. Die Schwellenwerte konvergieren also wie eine geometrische Folge
gegen Null.
Die drei bisher betrachteten ]acobi-Verfahren sollen in dieser Arbeit bezüglich
ihrer Konvergenz nä:her untersucht werden. In Anlehnung an die zyklischen
Verfahren wollen wir im folgenden auch beim klassischen und Schwellenwert
verfahren v aufeinanderfolgende Rotationen mit von 0 verschiedenen Rotations
winkeln als einen Zyklus bezeichnen, um bequeme Vergleichsmöglichkeiten zwi
schen den einzelnen Verfahren zu haben. Die Forderung (1.8) werden wir an
einer Stelle durch die schwächere Forderung
a(H 1) = a.Clc) a(k) mit I a.(k) I .;:: a. < 1 für alle k (1.17)
ij ij ij ij "'"
ersetzen. (1.17) berücksichtigt die Tatsache, daB im allgemeinen eine vollständige
Annullierung des Elementes a~:) nicht möglich ist, da ja nur mit endlich vielen
Dezimalstellen gerechnet werden kann.
Einige weitere V orgehensweisen, die aber im folgenden nicht weiter behandelt
werden sollen, seien dèr V ollständigkeit halber noch kurz skizziert:
a) Quasizyklische Verfahren: Gegeben ist eine natürliche Zahl '11* > v. In jeder
Folge von '11* aufeinanderfolgenden Rotationsindexpaaren 'llk, 'llk +1, .••
'llk+ .*-1 tritt jedes Indexpaar (p, q) mindestens einmal auf. Für '11* = v erhält
man ein zyklisches Verfahren.
b) Eingeschränktes ]acobi-Verfahren mit der Schranke tI>: Hier erfolgt eine An
nullierung des Rotationselementes a~~) nur dann, wenn I f{!k I ~ tI> ist. Andern
falls wird nur eine Drehung um den Winkel tI> sgn f{!k durchgeführt. Näheres
über a) und b) z. B. in [2].
c) S. Falk und P. Langemeyer [9] betrachten ein zyklisches ]acobi-Verfahren
mit Schwellenwerten für die allgemeine Eigenwertaufgabe det (A - AB) =0
mit symmetrischer Matrix A und positiv definiter Matrix B.
d) Die Übertragung des ]acobi-Verfahrens auf die Bestimmung der Eigenwerte
beliebiger Matrizen versuchen M. Lotkin [10] und ]. Greenstadt [11].
11