Lineare Algebra und Analytische Geometrie I Prof. Dr. Peter Knabner U¨berarbeitung eines Skripts von Prof. Dr. Wolf Barth Wintersemester 2006/2007 Institut fu¨r Angewandte Mathematik Friedrich-Alexander-Universit¨at Erlangen-Nu¨rnberg Martensstraße 3 91058 Erlangen e-mail: [email protected] Version vom 19. Februar 2008 Inhaltsverzeichnis 1 Der Zahlenraum Rn und der Begriff des reellen Vektorraums 3 1.1 Lineare Gleichungssysteme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 1.2 Vektorrechnung im Rn und der Begriff des R-Vektorraums . . . . . . . . . . . . . . . . 21 1.3 Lineare Unterr¨aume und das Matrix-Vektorprodukt . . . . . . . . . . . . . . . . . . . 34 1.4 Lineare (Un-) Abh¨angigkeit und Dimension . . . . . . . . . . . . . . . . . . . . . . . . 42 1.5 Das Euklidische Skalarprodukt im Rn und Vektorr¨aume mit Skalarprodukt . . . . . . 58 2 Matrizen und lineare Abbildungen 73 2.1 Bewegungen und allgemeine lineare Abbildungen . . . . . . . . . . . . . . . . . . . . . 75 2.2 Lineare Abbildungen und ihre Matrizendarstellung . . . . . . . . . . . . . . . . . . . . 82 2.3 Matrizenrechnung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90 2.4 Permutationen, Permutationsmatrizen und die LR Zerlegung einer Matrix . . . . . . . 126 2.5 Die Determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 138 2.6 Eigenschaften der Determinante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 142 3 Vom R-Vektorraum zum K-Vektorraum 153 3.1 Gruppen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153 3.2 K¨orper und Vektorr¨aume u¨ber K¨orpern . . . . . . . . . . . . . . . . . . . . . . . . . . 156 3.3 Euklidische und unit¨are Vektorr¨aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . 164 3.4 Quotientenvektorr¨aume . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170 3.5 Der Dualraum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176 3.6 Das Vektorprodukt . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 181 4 Koordinatentransformationen und A¨hnlichkeit von Matrizen 184 4.1 Basiswechsel und Koordinatentransformationen . . . . . . . . . . . . . . . . . . . . . . 184 4.2 Eigenwerttheorie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191 4.3 Der Satz von Cayley-Hamilton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212 4.4 Die Jordansche Normalform . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 221 4.5 Die Hauptachsentransformation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 233 4.6 Ausblick: Die Singul¨arwertzerlegung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241 2 1 Der Zahlenraum Rn und der Begriff des reellen Vektorraums 1.1 Lineare Gleichungssysteme Lineare Gleichungssysteme sind die einzige Art von Gleichungen in der Mathematik, welche wirklich exakt l¨osbar sind. Wir beginnen mit einem Beispiel, wie es schon aus der Antike u¨berliefert ist. Beispiel: In einem K¨afig seien Hasen und Hu¨hner. Die Anzahl der K¨opfe sei insgesamt 4, die Anzahl der Beine sei insgesamt 10. Frage: Wieviele Hasen und wieviele Hu¨hner sind es? L¨osung: Es sei x die Anzahl der Hasen und y die Anzahl der Hu¨hner. Dann gilt also x + y = 4 4x + 2y = 10 Dies ist ein System aus zwei linearen Gleichungen in zwei Unbekannten x und y. Wir k¨onnen aus der ersten Gleichung x= 4 y eliminieren und in die zweite einsetzen: − 4(4 y)+2y = 10 − 16 2y = 10 − 2y = 6 − − y = 3 x = 1 Antwort: Es sind drei Hu¨hner und ein Hase. Beispiel: Gegeben sei ein elektrisches Netzwerk der Form I I ?I ? 61 2 3 R R R 1 2 3 U Dabei seien die angelegte Spannung U und die Widerst¨ande R ,R ,R gegeben, die Stromst¨arken 1 2 3 I ,I und I sind gesucht. 1 2 3 L¨osung: Nach den sogenannten Kirchhoffschen Gesetzen der Physik hat man die Gleichungen I = 1 I +I ,sowieR I = R I undR I +R I = U (Dasistdiestattfindendemathematische Modellierung 2 3 2 2 3 3 1 1 2 2 des betrachteten Prozesses, siehe unten fu¨r genauere U¨berlegungen). Wir schreiben sie als ein System aus drei linearen Gleichungen in den drei Unbekannten I ,I und I : 1 2 3 I I I = 0 1 2 3 − − R I R I = 0 2 2 3 3 − R I + R I = U 1 1 2 2 Wir k¨onnen hier etwa I =I +I eliminieren, um folgendes System aus zwei linearen Gleichungen in 1 2 3 den Unbekannten I und I zu erhalten: 2 3 3 R I R I = 0 2 2 3 3 − (R +R )I + R I = U 1 2 2 1 3 HiereliminierenwirI = R3I (dagem¨aßihrerBedeutungimModellR = 0!)underhaltenschließlich 2 R2 3 2 6 die Gleichung R 3 (R +R ) I +R I = U 1 2 3 1 3 R 2 (R R +R R +R R )I = R U 1 2 1 3 2 3 3 2 R U 2 I = 3 R R +R R +R R 1 2 1 3 2 3 (siehe oben wegen der Division!) Aus den Eliminationsgleichungen fu¨r I und I erhalten wir 2 1 R U (R +R )U 3 2 3 I = , I = . 2 1 R R +R R +R R R R +R R +R R 1 2 1 3 2 3 1 2 1 3 2 3 Das letzte Beispiel gibt einen ersten Eindruck, warum und wie lineare Gleichungssysteme Fragen aus Naturwissenschaft und Technik (aber auch O¨konomie,...) modellieren. Schon deswegen ist wichtig sie mathematisch zu untersuchen. Dabei entstehen folgende Mathematische Fragen: A) Existenz einer L¨osung. Es gibt mindestens eine L¨osung. Nachweis durch a) “Konkrete” Angabe: - geht nur bei konkretem Beispiel, nicht bei allgemeinen Problem. - woher kommt die konkrete L¨osung? b) “Abstrakte” Argumentation: z.B. Widerspruchsbeweis Annahme: es gibt keine L¨osung ... ... Widerspruch (z.B. 0 = 1). ⇒ ⇒ ⇒ Eine L¨osung wird dadurch nicht bekannt. c) Angabe/Herleitung eines Algorithmus (“Rechenvorschrift”) zur Bestimmung einer L¨osung. Wenn diese nur endlich viele Schritte ben¨otigt, dann erh¨alt man durch (exakte) Durchfu¨hrung des Algorithmus die (exakte) Angabe einer L¨osung. B) Eindeutigkeit einer L¨osung Es gibt h¨ochstens eine L¨osung x ⇔ Sind x und y L¨osungen, dann x= y. Nachweis nur durch “abstrakte” Argumentation! 4 Die Fragen A) und B) sind i.A. unabh¨angig voneinander. Gilt A) und B), dann sagt man: Es gibt genau eine L¨osung. Da lineare Gleichungssysteme (i.F. kurz LGS) aus der Anwendung i.A. sehr groß sind (103 bis 108 Unbekannte bzw. Gleichungen) ist Handrechnen (wie oben) nicht mehr m¨oglich und die Frage nach (effizienten) Algorithmen wird besonders wichtig. Wir wollen diese Frage, die dann in der Vorlesung Numerische Mathematik I vertieft wird, so weit wie m¨oglich hier mitbehandeln. Im Zentrum steht aber die Theorie von linearen Strukturen (genauer sp¨ater). Die LGS sind dabei so wichtig, da sie der Anlass fu¨r die Entwicklung dieser Strukturen sind, mit deren wir mehr u¨ber LGS erfahren. - Eine solche Situation wird i.F. mit ALGS (Anwendung auf LGS) gekennzeichnet. - Daru¨ber hinaus werden wir aber auch sehen, dass sich “abstraktere“ Fragestellungen auf solche u¨ber LGS zuru¨ckfu¨hren lassen. - Eine solche Situation wird i.F. mit RLGS (Ru¨ckfu¨hrung auf LGS) gekennzeichnet. - DasersteZielistalsoeinZugangzurGesamtheit allerL¨osungen einesallgemeinenLGS.Diegegebenen Zahlen (die Koeffizienten) und die Unbekannten sollen dabei reelle Zahlen sein. Die Menge der reellen Zahlen wird (wie immer) mit R bezeichnet und in der Vorlesung Analysis I genau eingefu¨hrt. Von den Eigenschaften, die R bezu¨glich (a,b R) ∈ Addition + : a+b, • Multiplikation : a b bzw. kurz ab, • · · Ordnung: a b, • ≤ Abstandsmessung • hat, werden im Folgenden nur die bezu¨glich + und (siehe A1 zur Erinnerung) ben¨otigt. Dies erlaubt · sp¨ater, die folgenden U¨berlegungen zu verallgemeinern (zu GLS in K¨orpern). WirdiskutierenjetztdenAllgemeinfall, wobeiwirbesondersdaraufachten mu¨ssen,welcheSpezialf¨alle und Ausnahmen auftreten k¨onnen: Spezialfall 1: Eine Gleichung Eine lineare Gleichung ist eine Gleichung der Art a x +a x +...+a x = b , (1.1) 1 1 2 2 n n wo a ,a ,...,a ,b gegebene reelle Zahlen sind, und die reellen Zahlen x ,x ,...,x unbekannt und 1 2 n 1 2 n gesucht sind. Die geometrische Interpolation als Gerade, Ebene, ... werden wir sp¨ater besprechen. Wir mu¨ssen verschiedene F¨alle unterscheiden: A:Nichtalle Koeffizientena ,...,a sind0.Dannseietwaa ,1 m n,dererstevon0verschiedene 1 n m ≤ ≤ Koeffizient. Die Gleichung sieht so aus: 0 x +...+0 x +a x +a x +...+a x = b. 1 m−1 m m m+1 m+1 n n · · · · · Wirk¨onnenalsox ,...,x beliebigw¨ahlen,aufdieGu¨ltigkeitderGleichunghatdieskeinenEinfluss 1 m−1 . Ebenso k¨onnen wir x ,...,x beliebig w¨ahlen. Anschließend setzen wir m+1 n x := (b a x ... a x )/a . (1.2) m m+1 m+1 n n m − − − 5 Damit haben wir fu¨r jede Wahl der x ,...,x ,x ,...,x die Gleichung gel¨ost. Dies ist auf diese 1 m−1 m+1 n Weise nur m¨oglich, weil a = 0. m 6 Wir sagen: Die Menge aller L¨osungen von (1.1) hat n 1 Freiheitsgrade (Diesen Begriff werden wir − sp¨ater pr¨azisieren). B1: Alle Koeffizienten a ,...,a sind 0, aber es ist b = 0. Das Gleichungssystem hat dann die 1 n 6 merkwu¨rdige Form 0 x +...+0 x = b. (1.3) 1 n · · Egal, wie man auch die Unbekannten x ,...,x w¨ahlt, diese Gleichung ist nie zu erfu¨llen. 1 n Sie ist unl¨osbar. B2: Alle Koeffizienten a ,...,a sind 0 und auch b = 0. In diesem reichlich uninteressanten Fall ist 1 n die Gleichung stets erfu¨llt, sie stellt keinerlei Bedingungen an die Unbekannten. 0 x +...+0 x = 0 (1.4) 1 n · · Ein lineares Gleichungssystem ist ein System a x + a x + ... + a x = b 1,1 1 1,2 2 1,n n 1 a x + a x + ... + a x = b 2,1 1 2,2 2 2,n n 2 . . . . . . . . . . . . a x + a x + ... + a x = b m,1 1 m,2 2 m,n n m aus mehreren linearen Gleichungen. Hierbei sind die Koeffizienten a R, i = 1...,m, j = 1,...,n gegeben und die Unbekannten i,j ∈ x , j = 1,...,n gesucht. j - Hier und im Folgenden wird intensiv von der Indexschreibweise (siehe A3) Gebrauch gemacht.- Ein solches Gleichungssystem l¨asst sich ku¨rzer schreiben als a x +a x +...+a x = b µ = 1,...,m, µ,1 1 µ,2 2 µ,n n µ ∀ (µ te Zeile des Gleichungssystems) − oder ku¨rzer a x +a x +...+a x = b µ =1,...,m µ1 1 µ2 2 µn n µ ∀ (meistens auch nur: µ = 1,...,m) und schließlich mit der Notation (siehe auch A4) n a = a +...+a fu¨r a R, µ = 1,...,n ν 1 n µ ∈ ν=1 X n n (wobei natu¨rlich a = a = ...) ν k ν=1 k=1 in Kurzform P P n a x = b µ = 1,2,...,m. (LG) µ,ν ν µ · ∀ ν=1 X 6 Definition 1.1 Das System (LG) heißt ein linearesGleichungssystem (kurz: LGS) mit n Unbekann- ten x und m Gleichungen. Die Elemente a heißen die Koeffizienten, und die Elemente b rechte k j,k j Seiten. Das System heißt homogen, wenn b = 0 j = 1,2,...,m gilt; sonst heißt es inhomogen. j ∀ Die stets existierende L¨osung x1 = x2 = = xn = 0 des homogenen Systems heißt triviale L¨osung. ··· Die Zahlen x ,...,x mit x R,i= 1,...,n (etwa eine L¨osung von (LG)) fassen wir zusammen zu 1 n i ∈ x 1 . x:= .. = (xν)ν=1,...,n = (xν)ν (1.5) x n und nennen x ein n-tupel (u¨ber R), alle n-tupel zusammen bilden die Menge Rn. x R heißt ν-te ν ∈ Komponente von x. Es handelt sich dabei also um eine geordnete Menge (n = 2 : Paare, n = 3 : Tripel,...) von Elementen aus R,...,R (n-mal) (siehe A2), statt in der Form (x ,...,x ) als Zeile 1 n in der Form (1.5) (als Spalte) geschrieben. Wir suchen also alle x= (x ) Rn, die (LG) erfu¨llen. Dazu fu¨hren wir die folgende formale Schreib- ν ν ∈ weise ein. Definition 1.2 Die Koeffizientenmatrix des Gleichungssystems ist das rechteckige Zahlenschema a a ... a 1,1 1,2 1,n a a ... a 2,1 2,2 2,n A := . . . . (1.6) . . . . . . a a ... a m,1 m,2 m,n Wenn wir hieran die rechten Seiten der Gleichungen anf¨ugen a a ... a b 1,1 1,2 1,n 1 a a ... a b 2,1 2,2 2,n 2 (A,b) := . . . . , (1.7) . . . . . . . . a a ... a b m,1 m,2 m,n m so nennen wir dies erweiterte Koeffizientenmatrix. a ,...,a heißt die µ-te Zeile von A(µ = 1,...,m) und wird als n-tupel mit a abgek¨urzt. µ,1 µ,n (µ) a ,...,a heißt die ν-te Spalte von A(ν = 1,...,n) und wird als m-tupel mit a(ν) abgek¨urzt. 1,ν m,ν Die µ-te Zeile von A gibt also die Koeffizienten der µ-ten Gleichung an. Die ν-te Spalte gibt u¨ber alle Gleichungen die Koeffizienten der Unbekannten x an. Analog kann man auch von den Zeilen und ν Spalten von (Ab) sprechen. Bei den Spalten kommt also noch als (n+1)te Spalte | b 1 . b:= .. = (bµ)µ (1.8) b m 7 (die rechte Seite des Gleichungssystems) hinzu. Den Fall m = 1,n N (eine Gleichung) haben wir schon in (1.2)-(1.4) behandelt. Fu¨r beliebige m ∈ gibt es einen Spezialfall, wo auch kein Gleichungssystem im eigentlichen Sinn auftritt. Spezialfall 2: Diagonalsystem a 0 ... ... ... 0 1,1 0 ... ... . . . . . a . A = r,r . (1.9) .. .. . 0 . ... ... 0 ... ... ... 0 Alsoexistiereneinr 1,...,min(m,n) (sieheA4),sodassa = 0fu¨rµ = 1,...,r,aberalleanderen µ,µ ∈ { } 6 a verschwinden (d.h. a = 0 fu¨r µ =1,...,m,ν = 1...,n,µ = ν oder µ = ν > min(m,n)). µ,ν µ,ν 6 Eine Koeffizientenmatrix wie (1.9), bei der h¨ochstens a = 0, wenn µ = ν, heißt Diagonalmatrix. µν 6 Immer wenn r < m gilt (also immer bei n < m) treten also Nullzeilen in A auf (Zeilen a = (µ) (0,...,0)). Nach (1.3),(1.4) ist das System unl¨osbar, falls b = 0 fu¨r eine solche Nullzeile, sonst haben µ 6 die Nullzeilen keine Aussage. Die Zeilen µ = 1,...,r legen x fest durch µ x = b /a , µ = 1,...,r (1.10) µ µ µ,µ die weiteren x ,...,x sind frei w¨ahlbar (falls nicht der unl¨osbare Fall vorliegt), d.h. es gibt n r r+1 n − Freiheitsgrade in der L¨osungsmenge. DahiergarkeineKopplungenzwischendenUnbekanntenvorliegen,handeltessichumkein“richtiges“ System. Das ist der Fall bei folgendem Spezialfall, bei dem auch die L¨osungsmenge explizit angegeben werden kann und der Spezialfall 2 verallgemeinert: Spezialfall 3: Staffelsystem a ... ... ... a 1,1 1,n 0 ... ... . A= .. ar,r ... ar,n . (1.11) . . . . . . 0 ... ... ... 0 Also existiere ein r 1,...min(m,n) , so dass ∈ { } - a = 0 fu¨r µ = 1,...r, µ,µ 6 - das untere Dreieck der Matrix verschwindet, d.h. a = 0 fu¨r µ > ν,µ = 1,...,m,ν = 1,...,n, µ,ν - ab der (r +1) Zeile (falls es sie gibt), verschwinden die ganzen Zahlen, d.h. a = 0 fu¨r µ = µ,ν r+1,...,m, ν = 1,..., n. 8 Eine Koeffizientenmatrix wie (1.11) ist eine spezielle obere Dreiecksmatrix. Wieder entscheiden die b fu¨r µ = r + 1,...,m daru¨ber, ob das System l¨osbar ist oder nicht. Im µ l¨osbaren Fall sind die letzten m r Zeilen aussagelos und die L¨osungskomponenten x ,...,x frei r+1 n − w¨ahlbar. Dann ist die r-te Zeile nach x aufl¨osbar (da a = 0). Mit bekanntem x kann dann x r r,r r r−1 6 aus der (r 1)ten Zeile bestimmt werden etc. Diesen Prozess nennt man Ru¨ckw¨artssubstitution. − n 1 x = b a x , ν = r,r 1,...,1. (1.12) ν ν ν,µ µ a − · ∀ − ν,ν µ=ν+1 X Dabei ist n ... := 0 µ=n+1 X (oder allgemeiner jede Summe u¨ber einem leeren Indexbereich). Dies tritt fu¨r r = n, d.h. den Fall ohne Freiheitsgrade, fu¨r ν = r auf. Bei einigen Unterf¨allen l¨asst sich genaueres u¨ber die L¨osungsmenge sagen: Spezialfall 3a: m > n,r = n,b = 0 fu¨r µ = n+1,...,m. µ In diesem l¨osbaren Fall gibt es keine frei w¨ahlbaren Komponenten, die L¨osung ist also eindeutig. Spezialfall 3b: m > n und b = 0 fu¨r ein µ n+1,...,m . Das LGS ist nicht l¨osbar. µ 6 ∈ { } Was nu¨tzen die besprochenen F¨alle im Allgemeinen? Solange man dabei die L¨osungsmenge nicht ver¨andert, kann man versuchen, allgemeine LGS auf obige Formen umzuformen. Offensichtlich zul¨assig als Umformung ist die Vertauschung zweier Zeilen im Gleichungssystem. Dies entspricht der - Vertauschung zweier Zeilen in der erweiterten Koeffizientenmatrix (A,b). Es ist etwas umst¨andlich, alle LGS zu beschreiben, die sich so auf (1.11) transformieren lassen. Dies muss auch nicht wirklich durchgefu¨hrt werden, es reicht, wenn die Nichtnullzeilen in der Reihenfolge, die entstehen wu¨rde, in (1.12) durchlaufen werden. EineweitereUmformungistdieUmnummerierungderKomponentenderL¨osungstupel(dieamSchluss wieder ru¨ckg¨angig gemacht werden muss!). Diese entspricht der -Vertauschung zweier Spalten der Koeffizientenmatrix A. Vertauschung von Spalten macht aus (1.11) (und umgekehrt) den Spezialfall 4: Zeilenstufenform n0 n1 nr 0...0 # ... ... ... ∗ ∗ ∗ ∗ ∗ ∗ . 0 0...0 # ... ... z }| { z }| { ∗ ∗z }| ∗{ (1.13) . . . 0 . # ... ∗ ∗ . . . . . 0 0...0 0...0 0 0...0 0 0...0 0 0...0 # bezeichnet dabei Koeffizienten a = 0, * beliebige Koeffizienten. Dabei k¨onnen die Stufenl¨angen µ,ν 6 n ,n ,...,n eventuell 0 sein, und r 1,...,min(m,n) , die Anzahl der Stufen kann mit m u¨berein- 0 1 r ∈ { } stimmen, so dass also keine Nullzeilen am unteren Ende der Matrix auftreten. 9 Also gibt es zu jeder Zeile µ 1,...,m einen Index j(µ) 1,...,n+1 der den “ersten“ nicht ∈ { } ∈ { } verschwindenden Koeffizienten markiert, falls es einen gibt, und sonst = n+1 ist: a = 0 fu¨r ν = 1,...,j(µ) 1 µ,ν − a = 0 (falls j(µ) 6 n) µ,j(µ) 6 und j(1) 6 j(2) 6 ...j(m) . Bei j(µ) j(µ+1) gilt sogar <“, sofern j(µ+1) n. Ist µ¯ der gr¨oßte Index in 1,...,m , fu¨r den ≤ ” ≤ { } j(µ¯)6 n, dann ist das die Stufenanzahl r = µ¯ und ab der (r+1)ten Zeile (falls es solche gibt) stehen nur Nullzeilen. Die Stufenl¨angen sind n = j(1) 1 0 − n = j(i+1) j(i) 1 fu¨r i= 1,...,r . i − − Auchfu¨rdieseForml¨asstsichdieL¨osungsgesamtheitangeben,wasgerade(1.12)fu¨rdieumgeordneten Komponenten entspricht: x ,...,x sind frei w¨ahlbar. Zur Verdeutlichung nennen wir diese KomponentenParameter und n j(r)+1 bezeichnen Parameter mit λ : ν x : = λ n 1 . . . fu¨r λ R ν ∈ . . . x : = λ j(r)+1 nr x ist durch (1.12) bestimmt und dann sind (1.14) j(r) x : = λ j(r)−1 nr+1 . . . fu¨r λ R ν ∈ . . . x : = λ j(r−1)+1 nr+nr−1 frei w¨ahlbar. x ist durch (1.12) bestimmt etc., so dass man eine Darstellung aller L¨osungen der (LGS) in den j(r−1) r Parametern λ ,...,λ mit n¯ := n bekommt. 1 n¯ i i=0 Der Spezialfall 3 entspricht also nP= ...n 1 = 0, n = n r = n¯. 0 r r − − 10