FORSCHUNGSBERICHTE DES LANDES NORDRHEIN-WESTFALEN Nr. 1291 Herausgegeben im Auftrage des Ministerpräsidenten Dr. Franz Meyers von Staatssekretär Professor Dr. h. c. Dr. E. h. Leo Brandt DK 518.12 Dr. rer. nat. Gerhard Schrăder Rheinisch-WestJălisches Institut fur 1n strumentclle Mathematik Bonn (IIM) Dber clie Konvergenz einiger Jacobi-Verfahren zur Bestimmung cler Eigenwerte symmetrischer Matrizen SPRINGER FACHMEDIEN WIESBADEN GMBH 1964 ISBN 978-3-322-97936-0 ISBN 978-3-322-98498-2 (eBook) DOI 10.1007/978-3-322-98498-2 Verlags-Nr.011291 © 1964 Springer Fachmedien Wiesbaden Urspriinglich erschienen bei Westdeutscher Verlag, K5ln und Op1aden 1964 Gesamtherstellung: Westdeutscher Verlag • lnhalt Einleitung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 1. Das Jacobi-Verfahren ....................................... ..... 8 2. Konvergente Jacobi-Verfahren .......... .................. ...... .. 12 3. Konvergenzbeweis für zyklische Jacobi-Verfahren ................... 16 4. Zur Konvergenz von Zahlenfolgen ................................ 23 5. Allgemeine Aussagen bei symmetrischen Matrizen ................... 28 6. Spezielle Aussagen für einen Schritt der Jacobi-Verfahren ............ 37 7. Die Konvergenz der J acobi-Verfahren bei beliebiger Eigenwertverteilung 41 8. Beispiele........................................................ 48 9. Tabellen, Literaturverzeichnis ................... " ............... , 52 5 Einleitung Im folgenden solI das Konvergenzverhalten der wichtigsten Jacobi-Verfahren zur Bestimmung der Eigenwerte symmetrischer Matrizen der Ordnung n (n ~ 2) untersucht werden. Behandelt werden das klassische Verfahren, die zyklischen Verfahren und die zyklischen Schwellenwertverfahren (cyclic methods with thresholds). Für eine gro13e Anzahl zyklischer Verfahren wird ein neuer Konver genzbeweis gebracht, der im FalIe einfacher Eigenwerte sowie in gewissen Fällen auch bei Vorhandensein doppelter Eigenwerte quadratische Konvergenz liefert, wobei gleichzeitig die von A. Schönhage [8] angegebenen Abschätzungskon stanten verbessert werden. Auf einem anderen Wege werden genauere qualitative Aussagen über die Güte der Konvergenz bei allen 3 behandelten V orgehensweisen im FalIe einfacher Eigenwerte abgeleitet, und die Ergebnisse von P. Henrici [2] wesentIich verbessert. Für das klassische und die zyklischen Schwellenwertverfah ren wird dieser Weg unter Anwendung eines Hilfssatzes, der über die Lage der Maximalelemente au13erhalb der Hauptdiagonale bei symmetrischen Matrizen Auskunft gibt, Aussagen über die Konvergenz bei beliebigem Spektrum ermög lichen. Dabei wird sich zeigen, daB im allgemeinen um so bessere Konvergenz herrscht, j'e mehr Eigenwerte übereinstimmen. Der Einfachheit halber werden nur symmetrische Matrizen behandelt. Durch geeignete Modifikationen lassen sich die Ergebnisse ohne weiteres auf hermetische Matrizen übertragen. Zur Bezeichnungsweise: Matrizen werden durch groBe lateiriische Buchstaben, reelIe Zahlen durch kleine lateinische oder griechische Buchstaben bezeichnet. Falls kleine lateinische Buchstaben Vektoren bedeuten sollen, wird an der betreffen den Stelle ausdrücklich darauf hingewiesen. 7 1. Das ]acobi-Verfahren V orgelegt sei die symmetrische Matrix A der Ordnung n, deren n Eigenwerte bestimmt werden sollen. Dazu wird eine Folge von symmetrischen Matrizen der Ordnung n (1.1) konstruiert, in der die Matrizen Ak rekursiv definiert sind durch (k=O, 1,2, ... ). (1.2) Dabei ist Uk eine Orthogonalmatrix, d. h. U~ = U~ \ die sich von der Einheits matrix E nur in einer zweidimensionalen Untermatrix unterscheidet. Eine Ortho gonalmatrix der Ordnung 2 hat allgemein die Form - sin cp), (1.3) cos cp wobei für den Winkel cp die Einschrankung - n < cp ~ n angenommen werden kann. Damit läBt sich über die Definition der Matrizen Uk = (u;J» genauer sagen: Für jedes k existiert ein Paar von Indizes (i,) mit 1 ~ i <) ~ n sowie ein Winkel ([!k, so daB mit dem Kronecker-Symbol Opq gilt U(k) = U(k) = cos mk, (1.4.1) ii ii -r U(ikj ) = - uUiic ) = - sin m-r k , (1.4.2) u(k) = 0 sonst . (1.4.3) pq pq Wir wollen sagen, daB die Matrix Uk, die den Übergang von Ak zu Ak + 1 bewirkt, die k -te Rotation von A = A 0 definiert mit dem Rotationswinkel CPk. Irgend einen Satz von Regeln zur Auswahl der Rotationsmatrizen Uk nennen wir ein J aco bi-Verfahren. Falls unter den gegebenen Regeln limAk=D (1.5) k --HIJ gilt, wobei D eine Diagonalmatrix sein solI, heiBt das Jacobi-Verfahren konver gent. Da sich die Eigenwerte von Ak beim Übergang zu Ak + 1 nicht ändern, enthält die Hauptdiagonale von D dann die Eigenwerte von A in irgendeiner Reihenfolge. 8 Die Elemente a~/ 1) von Ak +1 ergeben sich aus den Elementen a~~ von Ak mit (1.2) und (1.4.1) bis (1.4.3) wie folgt: = .!. + + .!. + ai(jH 1) 2 (a(ik! ) ari1k ») 2 (a(iki) - aCjkj ») cos 2 fTf lk arikj ) sin 2 fTf lk , (1 • 6 • 1) =.!. + .!. a1(1H 1) 2 (a(iki) ariki» ) - 2 (a(iki) - arikj» ) cos 2 fTf lk - arikj ) sin 2 fTf lk , (1 • 6 • 2) a(k+l)=a(k) (163) pp pp' •• = - .!. + a(ikj + 1) 2 (a(ikj) - ariki» ) sin 2 mT k ariki ) cos 2 fTf lk , (1 • 6 • 4) a~k+ 1) =' a~k) cos mk +a(k) sin mk (1.6.5) 'p 'p T ip T' + a(k+ 1) = - ik) sin fflk ark) cos mk (1.6.6) jp lp T jp T' a(Hl) =a(k) (1.6.7) pq pq mit p und q verschieden von i und j. C. G. J. Jacobi [1] schlug bereits 1846 folgenden Satz von Regeln zur Bestim mung des Indexpaares nk = (i, J) sowie des Rotationswinkels qJk in der k-ten < < Rotationsmatrix vor. Man wähle i undj mit 1 i <j n so, daB (1.7) und (1.8) gilt, d. h. die Transformationsmatrix Uk wird so bestimmt, daB das Element (bzw. eines der Elemente) maximalen Betrages auBerhalb der Hauptdiagonale nach der Rotation verschwindet. Für qJk folgt daraus wegen (1.6.4) die Gleichung (1.9) Um Eindeutigkeit in der Wahl des Winkels qJk zu erreichen, solI zusätzlich --n< <n- (1.10) 4 qJk 4 gefordert werden. Falls für das durch (1.7) definierte Indexpaar (i,j) a;~) = 0 gilt, ist Ak gleich der gesuchten Diagonalmatrix D. Die Vorgehensweise nach den Regeln (1.2), (1.7), (1.8) und (1.10) wollen wir im folgenden als »klassisches Jacobi-Verfahren« bezeichnen. Eine Matrix der Ordnung n hat oberhalb der Hauptdiagonale v=n(n-l) (1.11) 2 9 Elemente. Bei jedem Schritt des klassischen ]acobi-Verfahrens sind also v Zahlen zu prüfen, urn das Maximaielement zu finden. Vergleicht man damit die Anzahl + der arithmetischen Operationen pro Schritt, so sind hier 2 n 3 Additionen, 4 n - 3 Multiplikationen, 2 Divisionen und 2 Quadratwurzelbestimmungen durch zuführen. Berechnet man zusätzlich noch das Matrizenprodukt U = U 0 • UI· ... , die so entstehende Matrix U enthält als Gesamttransformationsmatrix in den Spalten die normierten Eigenvektoren von A, so kommen weitere 2 n Addi tionen und 4 n Multiplikationen pro Schritt hinzu. In beiden FäUen ist die Anzahl der arithmetischen Operationen proportional zur Ordnung n der Matrix, während die Anzahl der Vergleiche pro Schritt proportional zum Quadrat der Ordnung von A ist. In den letzten Jahren sind daher, spezieU in Verbindung mit der Entwicklung elektronischer Rechenanlagen, Regeln zur Bestimmung der Rotationsindexpaare nk vorgeschlagen worden, bei denen der Gesamtaufwand pro Schritt nur noch proportional n ist. Die wichtigsten dieser Regeln definieren die sogenannten »zyklischen Jacobi Verfahren« (Gregory, [3]). Hier wird jedes der v Elemente oberhalb der Haupt diagonale innerhalb eines Zyklus von v Rotationen genau einmal annulliert, und zwar stets in der gleichen Reihenfolge. Es gilt also (1.12) Vorzugsweise 2 Vorgehensweisen bieten sich hier an, nämlich das zeilenweise Vorgehen mit der Indexpaarauswahl (wir bezeichnen der Deutlichkeit halber das Indexpaar der k-ten Rotation hier mit ik,jk) (ik - 1,jk -1 + 1) für ik -1 < n + + _ 1( ik - 1 1, ik - 1 2) für ik - 1 < n - 1 ,jk - 1 = n (1.13) nk - (1 , 2) fu"r" "Ik - 1 = n - 1 ,jk" - 1 = n und für k=O sowie das spaltenweise V orgehen mit der Indexpaarauswahl für ik - 1 < jk - 1 - 1 für ik - 1 = j k - 1 - 1 ,jk -1 < n (1.14) für ik - 1 = n - 1 ,jk - 1 = n und für k=O. Durch die Regeln (1.13) bzw. (1.14) und (1.2), (1.8) und (1.10) sind damit zwei zyklische J acobi-Verfahren gegeben. Die gleichen Vorschriften wie bei den zyklischen Verfahren werden auch bei den »zyklischen ]acobi-Verfahren mit SchweUenwerten« benutzt. Nur (1.8) wird ersetzt durch {a i~+ 1) ==; 0 faUs I ai~) I > f}z, (1.15) gJk = 0, also Uk = E sonst . 10 Dabei bilden die {Jz (/=0,1,2, ... ) eine monotone Nullfolge positiver Zahlen mit unendlich vielen von Null verschiedenen Elementen. Wenn für alle a~~ die Ungleichung I a~~ I < {)z erfüllt ist, wird {)z durch {)z + 1 ersetzt. Die einzelnen Elemente oberhalb der Hauptdiagonale werden also in einer festen zyklischen Reihenfolge mit den Schwellenwerten {)z verglichen und nur dann annulliert, wenn sie betragsmäBig gröBer oder gleich {)z sind. Sind sie kleiner, erfolgt keine Rotation (siehe [4]). Wir wollen hier die zyklischen Schwellenwertverfahren mit der üblichen speziellen Schwellenwertwahl ({)o > 0, 0 < 'YJ < 1,1= 1,2, ...) (1.16) betrachten. Die Schwellenwerte konvergieren also wie eine geometrische Folge gegen Null. Die drei bisher betrachteten ]acobi-Verfahren sollen in dieser Arbeit bezüglich ihrer Konvergenz nä:her untersucht werden. In Anlehnung an die zyklischen Verfahren wollen wir im folgenden auch beim klassischen und Schwellenwert verfahren v aufeinanderfolgende Rotationen mit von 0 verschiedenen Rotations winkeln als einen Zyklus bezeichnen, um bequeme Vergleichsmöglichkeiten zwi schen den einzelnen Verfahren zu haben. Die Forderung (1.8) werden wir an einer Stelle durch die schwächere Forderung a(H 1) = a.Clc) a(k) mit I a.(k) I .;:: a. < 1 für alle k (1.17) ij ij ij ij "'" ersetzen. (1.17) berücksichtigt die Tatsache, daB im allgemeinen eine vollständige Annullierung des Elementes a~:) nicht möglich ist, da ja nur mit endlich vielen Dezimalstellen gerechnet werden kann. Einige weitere V orgehensweisen, die aber im folgenden nicht weiter behandelt werden sollen, seien dèr V ollständigkeit halber noch kurz skizziert: a) Quasizyklische Verfahren: Gegeben ist eine natürliche Zahl '11* > v. In jeder Folge von '11* aufeinanderfolgenden Rotationsindexpaaren 'llk, 'llk +1, .•• 'llk+ .*-1 tritt jedes Indexpaar (p, q) mindestens einmal auf. Für '11* = v erhält man ein zyklisches Verfahren. b) Eingeschränktes ]acobi-Verfahren mit der Schranke tI>: Hier erfolgt eine An nullierung des Rotationselementes a~~) nur dann, wenn I f{!k I ~ tI> ist. Andern falls wird nur eine Drehung um den Winkel tI> sgn f{!k durchgeführt. Näheres über a) und b) z. B. in [2]. c) S. Falk und P. Langemeyer [9] betrachten ein zyklisches ]acobi-Verfahren mit Schwellenwerten für die allgemeine Eigenwertaufgabe det (A - AB) =0 mit symmetrischer Matrix A und positiv definiter Matrix B. d) Die Übertragung des ]acobi-Verfahrens auf die Bestimmung der Eigenwerte beliebiger Matrizen versuchen M. Lotkin [10] und ]. Greenstadt [11]. 11