Grimm Fundamentale Wechselkursprognose mit Neuronalen Netzen GABLER EDITION WISSENSCHAFT Günter Grimm Fundamentale Wechsel ku rsprognose mit Neuronalen Netzen Traditionelle versus neuere Ansätze zur Wechselkursbestimmung Mit ei nern Geleitwort von Prof. Dr. Manfred Borchert DeutscherUniversitätsV erlag Die Deutsche Bibliothek -ClP-Einheitsaufnahme Grimm, Günler: Fundamentale Wechselkursprognose mit Neuronalen Netzen : traditionelle versus neuere Ansätze zur Wechselkursbestimmung / Günter Grimm. Mit einem Geleilw. von Manfred Borchert. -Wiesbaden: Dt. Univ.-Verl. ; Wiesbaden : Gabler, 1997 (Gabler Edition Wissenschaft) Zugl.: Münster, Univ., Diss., 1996 ISBN 978-3-8244-6551-4 ISBN 978-3-663-05677-5 (eBook) DOI 10.1007/978-3-633-05677-5 D 6 (1996) Der Deutsche Universitäts-Verlag und der Gabler Verlag sind Unternehmen der Bertelsmann Fachinformation. Gabler Verlag, Deutscher Universitäts-Verlag, Wiesbaden © Betriebswirtschaftlicher Verlag Dr. Th. Gabler GmbH, Wiesbaden 1997 lektorat: Ute Wrasmann / Brigitte Knöringer Das Werk einschließlich aller seiner Teile ist urheberrechrlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsge setzes ist ohne Zustimmung des Verlages u.~zulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Ubersetzungen, Mikroverfil mungen und die Einspeicherung uno Verarbeitung in elektronischen Systemen. Höchste inhalrliche und technische Qualität unserer Produkte ist unser Ziel. Bei der Produktion und Auslieferung unserer Bücher wollen wir die Umwelt schonen: Dieses Buch ist auf säurefreiem und chlorfrei gebleichtem Papier gedruckt. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, daß solche Namen im Sinne der Warenzeichen-und Markenschutz-Gesetzgebung als frei zu betrachten wören und daher von jedermann benutzt werden dürften. ISBN 978-3-8244-6551-4 -v- Geleitwort Der Einsatz neuronaler Netze fiir Anwendungsgebiete in der Finanzwirtschaft erfreut sich in der Vergangenheit immer stärkerer Beliebtheit. Eine Anwendungsmöglichkeit besteht unter anderem in der Prognose von Wechselkursen mit Hilfe fundamental ori entierter Wechselkurstheorien, deren empirische Überprüfung mit neueren quantitati ven Verfahren sich der Autor zum Ziel dieser Arbeit gesetzt hat. In einem ersten großen Hauptabschnitt fiihrt der Autor daher in die Theorie der neuro nalen Netze ein, die ein mächtiges Werkzeug zur ModelIierung nicht-linearer Zusam menhänge darstellen. Obgleich dies ein sehr komplexes Unterfangen ist, gelingt es, eine fiir den Leser gut verständliche Einfiihrung über die Funktionsweise neuronaler Netze zu geben. Zudem wird deren Aufbau mit der Verfahrensweise des linearen Pen dants verglichen. Der zweite Hauptabschnitt enthält eine gelungene Darstellung der derzeit geläufigsten Wechselkurstheorien und vollzieht sie einer empirischen Überprüfung. Dabei werden im Einzelnen die folgenden Theorien untersucht: • die gedeckte und ungedeckte Zinsparität, • die absolute und relative Kautkraftparität, • die monetären Ansätze, • die keynesianischen und postkeynesianischen Wechselkurstheorien sowie • Mischformen von monetären und keynesianischen Ansätzen. Um zu untersuchen, ob eine Ursache der bisher nur ungenügenden Erklärung von Wechselkursbewegungen in einer möglicher Weise nicht adäquaten Verknüpfung der zu erklärenden und den erklärenden Variablen liegt, vergleicht der Autor einen linea ren mit einem nicht-linearen ökonometrischen Schätzansatz in Form eines neuronalen Netzes. Sind tatsächlich nicht-lineare Strukturen in den Daten vorhanden, so sollte das neuronale Netz in der Lage sein, diese zu erfassen und abzubilden. In den bisherigen Untersuchungen zur Wechselkursprognose sind wichtige potentielle Determinanten nicht in die Analyse eingebunden worden. Dieser Punkt wird in der postkeynesianischen Theorie mit der Einbeziehung der Sachkapitalrendite aufgegrif fen. Der zweite Hauptabschnitt endet mit einem ausfiihrlichen Paradigmenvergleich, wel cher noch einmal die wichtigsten Unterschiede und Ergebnisse zusammenfaßt. Abge schlossen wird die Arbeit mit einer Schlußbetrachtung und einem Ausblick. Insgesamt ist es dem Autor gelungen, einen fiir den Leser allgemein verständlichen Zugang zu der zum Teil doch recht komplexen Materie zu finden. Daher wäre es die sem Werk zu wünschen, wenn es eine weite Verbreitung finden würde. Manfred Borchert -vii - Vorwort An dieser Stelle möchte ich mich ganz herzlich bei denjenigen bedanken, die durch Kritik, Anregungen und kontrovers geführte Diskussionen zum Gelingen dieser Dis sertation beigetragen haben. Als erstem gebührt meinem Doktorvater, Herrn Professor Dr. Manfred Borchert, Inha ber des Lehrstuhls für Volkswirtschaftslehre, insbesondere Geld und Währung an der Westfälischen Wilhems-Universität Münster, mein besonderer Dank, der mir während meiner Assistententätigkeit am Lehrstuhl über das Studium hinaus sehr viel Wissens wertes vermittelt hat. Hinzu kamen die vielen kritischen Fragen bezüglich meiner Ar beit, die mir ständig neue Denkanstöße gaben. Aber auch meinem Zweitgutachter, Herrn Professor Dr. Wolfgang Ströbele, Inhaber des Lehrstuhls für Volkswirtschafts theorie der Universität Münster möchte ich herzlich danken. An der empirischen Umsetzung des Dissertationsthemas haben Herr Dr. Hans-Georg Zimmermann, Leiter der Arbeitsgruppe Neuronale Netze in der Ökonomie bei der Siemens AG, München und die Mitarbeiter seines Teams sehr großen Anteil. Zum ei nen durch zahlreiche Diskussionen, Anregungen und durch die Bereitstellung einer von der Siemens AG entworfenen Software Entwicklungsumgebung für Neuronale Netze (SENN). Zum anderen jedoch auch für die schier unerschöpfliche Geduld, die aufgrund meiner zahlreichen Fragen stark herausgefordert wurde. Zudem gilt mein Dankeswort der Bayerischen Hypotheken-und Wechsel- Bank AG in München, die dieses Projekt finanziell und materiell unterstützt hat. Zum einen durch die Einrichtung eines Arbeitsplatzes und zum anderen durch die Bereitstellung der er forderlichen Daten für den empirischen Teil der Arbeit. Zudem habe ich auch hier sehr viele kompetente Gesprächspartner vorgefunden. Zu guter letzter möchte ich mich bei meinen Eltern und Geschwistern, Freunden und Bekannten für die moralische Unterstützung, die gelesenen Korrekturfahnen sowie die zahlreichen anregenden Diskussionen bedanken. Günter Grimm -ix- Inhaltsverzeichnis Abbildungsverzeichnis xii Tabellenverzeichnis xviii Abkürzungsverzeichnis xxii Symbolverzeichnis xxv Indizes xxvi 1 Einleitung 1 2 Einf"tihrung in die Theorie neuronaler Netze 8 2.1 Historische Entwicklung und ökonomische Interpretation eines Neurons 8 2.2 Aufbau und ökonomische Interpretation eines Mehrschichtnetzwerkes 16 2.3 Lemalgorithmen 21 2.4 Das Phänomen der Über-und Unteranpassung 28 2.5 Möglichkeiten der Komplexitätsreduktion eines neuronalen Netzwerkes 33 2.5.1 Stopped Training Methode 33 2.5.2 Addition von Rauschen über die Eingangszeitreihen und Penalty-Verfahren 34 2.5.3 Löschen der betragsmäßig kleinsten Gewichte (Standard-Weight-Pruning) 36 2.5.4 Optimal Brain Damage (OBD-Pruning) 37 2.5.5 Early Brain Damage (EBD-Pruning) 39 2.5.6 Statistisches Gewichtsausdünnungsverfahren nach FinnojjlZimmermann/Hergert (S-Pruning) 40 2.5.7 Optimierung der Anzahl der Neuronen in der Zwischen- und Eingabeschicht 42 2.6 Ermittlung der relevanten Zusammenhänge mittels Sensitivitätsanalysen 43 2.7 Netzwerktopologien 44 2.8 Vergleich lineare Regression und neuronales Netz 48 2.9 Vorgehensweise beim Modellbau mit neuronalen Netzen 52 -x- 3 Wechselkursprognose mit Hilfe ökonomischer Wechselkurstheorien 67 3.1 Begriffliche Grundlagen: Nominaler und realer Wechselkurs 67 3.2 Bausteine fundamentaler Ansätze der Wechselkursbestimmung 68 3.2.1 Das Kaufkraftparitätentheorem 70 3.2.2 Das Zinsparitätentheorem 73 3.2.3 Empirischer Befund zu den Bausteinen fundamentaler Wechselkurstheorien 80 3.2.3.1 Empirischer Befund zur absoluten und relativen Kaufkraftparitätentheorie 80 3.2.3.2 Empirischer Befund zur gedeckten und ungedeckten Zinsparität 91 3.2.4 Zusammenfassung der Ergebnisse und Kritik an den Bausteinen fundamentaler Wechselkurstheorien 99 3.3 Monetäre Ansätze der Wechselkursbestimmung 102 3.3.1 Der klassische monetäre Ansatz 102 3.3.2 Neuere monetäre Ansätze 107 3.3.2.1 Das Grundmodell des neueren monetären Ansatzes 107 3.3.2.2 Monetärer Ansatz mit adaptiven Wechselkurserwartungen 110 3.3.2.3 Monetärer Ansatz mit rationalen Wechselkurserwartungen 112 3.3.3 Empirischer Befund zu den monetären Ansätzen der Wechselkursbestimmung 114 3.3.4 Zusammenfassung der Ergebnisse und Kritik an den monetären Ansätzen 119 3.4 Keynesianische Ansätze der Wechselkursbestimmung 120 3.4.1 Der handelsbilanzorientierte Ansatz 120 3.4.2 Das Einkommen-Ausgaben-Modell 121 3.4.3 Das Mundell-Fleming-Modell 125 3.4.3.1 Das Mundell-Fleming-Modell mit fixen Preisen 125 3.4.3.2 Das Grundmodell bei imperfekter Kapitalmobilität 139 3.4.4 Empirischer Befund zu den keynesianischen Ansätzen der Wechselkurs bestimmung 140 3.4.5 Zusammenfassung der Ergebnisse und Kritik an den keynesianischen Ansätzen 146 - XI - 3.5 Wechselkursmodelle mit monetären und keynesianischen Elementen 149 3.5.1 Das Modell von Dornbusch 149 3.5.2 Das Realzinsdifferenzenmodell von Frankel 153 3.5.3 Empirischer Befund zu den Wechselkursmodellen mit monetären und keynesianischen Elementen 157 3.5.3.1 Empirischer Befund zum Modell von Dornbusch 157 3.5.3.2 Empirischer Befund zum Realzinsdifferenzenmodell von Frankel 161 3.5.4 Zusammenfassung der Ergebnisse und Kritik an den Modellen von Dornbusch und Frankel 165 3.6 Postkeynesianische Wechselkurstheorie 166 3.6.1 Die Portfoliotheorie des Wechselkurses 166 3.6.1.1 Kurzfristige Wechselkursbestimmung im Portfoliomodell 167 3.6.1.2 Langfristige Wechselkursbestimmung im Portfoliomodell 177 3.6.2 Makroökonomische Portfoliotheorie des Wechselkurses 183 3.6.3 Die Rolle der Risikoprämie in den postkeynesianischen Ansätzen 187 3.6.4 Empirischer Befund zu den postkeynesianischen Ansätzen der Wechselkursbestimmung 191 3.6.5 Zusammenfassung der Ergebnisse und Kritik an den portfoliotheoretischen Ansätzen 200 3.7 Vergleich der Paradigmen 201 4 Schlußbetrachtung und Ausblick 212 Literaturverzeichnis 264 -xii - Abbildungsverzeichnis Abbildung I: Aufbau eines biologischen Neurons 9 Abbildung 2: Das künstliche Neuron als Entscheidungsmodell am Beispiel einer Wechselkursprognose 12 Abbildung 3: Heaviside Sprungfunktion 14 Abbildung 4: Logistische Aktivierungsfunktion 14 Abbildung 5: Tangens Hyperbolicus Aktivierungsfunktion 14 Abbildung 6: Lineare Aktivierungsfunktion 15 Abbildung 7: Das Mehrschichtnetzwerk (Multilayer Perceptron (MLP» 16 Abbildung 8: Das Mehrschichtnetzwerk in Cluster Form 17 Abbildung 9: Informationsfluß durch das Standardmodell 19 Abbildung 10: Mögliche Fehlerfläche eines neuronalen Netzes 23 Abbildung 11: Mögliche Fehlerfläche eines linearen Modells 23 Abbildung 12: Prinzip des Gradientenverfahrens und die Problematik eines lokalen und globalen Minimums 26 Abbildung 13: Einteilung der Daten in eine Trainings-, Validierungs-und Generalisierungsmenge 30 Abbildung 14: Das Phänomen der Überanpassung 31 Abbildung 15: Möglichkeiten der Komplexitätsreduktion eines neuronalen Netzes 33 Abbildung 16: Berechnung der Testgröße beim EBD-Pruning 39 Abbildung 17: Erweitertes Standardmodell mit direkter Eingabe-Ausgabe- Verbindung 45 Abbildung 18: Netzwerktopologie mit mehreren Eingangsschichten 45 Abbildung 19: Expert-Council Topologie 47 Abbildung 20: Neuronales Netz mit Rückkopplung (Rekurrente Netzwerktopologie) 47 Abbildung 21: Vergleich absolute und quadratische Fehlerfunktion 49 Abbildung 22: Schätzvergleich neuronales Netz und lineare Regression am Beispiel einer Parabel 51 Abbildung 23: Allgemeine Vorgehensweise beim Modellbau mit neuronalen Netzen 52 Abbildung 24: Verwendete Netzwerktopologie 59 Abbildung 25: Ungedeckte Zinsparität 78 Abbildung 26: Vergleich lineares und nicht-lineares Modell am Beispiel der absoluten DM-Dollar Kautkraftparität 84 Abbildung 27: Vergleich lineares und nicht-lineares Modell am Beispiel der absoluten DM-Yen Kautkraftparität 85 Abbildung 28: Sensitivitätsanalyse des multilateralen nicht-linearen Modells mit S-Pruning und Noise am Beispiel der absoluten DM-Dollar Kautkraftparität 87 Abbildung 29: Vergleich lineares und nicht-lineares Modell am Beispiel der relativen DM-Dollar Kautkraftparität 89