ebook img

Neuronale Netze zur Analyse von nichtlinearen Strukturmodellen mit latenten Variablen PDF

282 Pages·2001·6.26 MB·German
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Neuronale Netze zur Analyse von nichtlinearen Strukturmodellen mit latenten Variablen

Zander Neuronale Netze zur Analyse von nichtlinearen Strukturmodellen mit latenten Variablen GABLER EDITION WISSENSCHAFT Adolf Zander Neuronale Netze zur Analyse von nichtlinearen StruKturmodellen mit latenten Variablen Mit einem Geleitwort von Prof. Dr. Dr. h .c. Helmut Schmalen Springer Fachmedien Wiesbaden GmbH Die Deutsche Bibliothek -CIP-Einheitsaufnahme Zander, Adolf : Neuronale Netze zur Analyse von nichtlinearen Strukturmodellen mit Iotenten Variablen I Adolf Zander. Mit einem Geleitw. von Helmut Schmalen. -1. AuR .. (Gabler Edition Wissenschaft) Zugl.: Possou, Univ., Diss., 2000 ISBN 978-3-8244-7259-8 ISBN 978-3-322-99297-0 (eBook) DOI 10.1007/978-3-322-99297-0 1 . Au Rage Februar 2001 Alle Rechte vorbehalten ©Springer Fachmedien Wiesbaden 2001 Ursprünglich erschienen bei Betriebswirtschaftlicher Verlog Dr. Th. Gabler GmbH, Wiesbaden, und Deutscher Universitäts-Verlag GmbH, Wiesbaden, 2001 Softcover reprint of the hardcover 1st edition 2001 Lektorat: Brigitte Siegel I Viola Leuschner Das Werk einschließlich oller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verloges unzulässig und strafbar. Das gilt insbeson dere für Vervielföltigungen, Ubersetzungen, Mikroverfilmungen und die Ein speicherung und Verarbeitung in elektronischen Systemen. www.gobler.de www.duv.de Höchste inhaltliche und technische Qualität unserer Produkte ist unser Ziel. Bei der Produktion und Verbreitung unserer Werke wollen wir die Umwelt schonen. Dieses Buch ist deshalb auf säure freiem und chlorfrei gebleichtem Papier gedruckt. Die Einschweißfolie besteht aus Polyethylen und damit aus organischen Grundstoffen, die weder bei der Herstellung noch bei der Verbren nung Schadstoffe Freisetzen. Die Wiedergabe von Gebrouchsnomen, Hondelsnomen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Na men im Sinne der Warenzeichen-und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. ISBN 978-3-8244-7259-8 Geleitwort V Geleitwort Erklärungsmodelle mit latenten Variablen spielen in der empirischen Marketing-Grundlagen forschung eine nicht unbedeutende Rolle. Häufig dürften die Beziehungen zwischen den la tenten Variablen nichtlinear sein. Die Schätzung nichtlinearer Strukturmodelle ist mit der Ko varianzstrukturanalyse jedoch nur in Ausnahmefällen überhaupt möglich - von den damit verbundenen Problemen ganz abgesehen. Für die Schätzung des Modells mit beliebigen nichtlinearen Beziehungen zwischen zwei la tenten Variablen entwickelt Adolf Zander eine spezielle Verschaltung des autoassoziativen Multi-Layer-Perceptrons und adaptiert Maße flir die Güte der Schätzung aus der Literatur. In einer Monte-Cario-Simulation untersucht er den Ansatz auf seine Eignung und Robustheil im Vergleich zu subjektiven Anspruchsniveaus sowie im Vergleich zur Referenzmethodik, dem LISREL-Ansatz der Kovarianzstrukturanalyse. Dabei analysiert er bei beiden Schätzansätzen ein lineares und nichtlineares Modell über insgesamt 24 Faktorstufenkombinationen der Fak toren "Art des Zusammenhangs", "Varianzerklärungsanteil im Strukturmodell" und "Skala" der Indikatorvariablen. Angesichts der Vielzahl an untersuchten Modellformulierungen und Szenarien hat der Verfas ser seine Betrachtung auf ein kleines Modell beschränkt. Das Abschneiden des vorgeschlage nen Schätzansatzes in der Montc-Cario-Analyse ist eher ernüchternd: Der Forscher erkauft sich die in einigen Fällen bessere Schätzung der nichtlinearen Zusammenhänge durch eine schlechtere Schätzung anderer Modelltcile, eine höhere Modellkomplexität und größeren Schätzaufwand. Nach der bereits erfolgreichen Anwendung der Neuronalen Netze auf nichtlineare Prognose und Klassifikationsproblemstellungen steht die Adaption der Neuronalen Netze auf die kom plexere Problemstellung der Strukturmodelle mit latenten Variablen sicherlich noch am An fang ihrer Entwicklung. Die vorliegende Arbeit ist als ein erster Schritt auf diesem steinigen Weg zu werten. Ich wünsche dieser Arbeit viel Aufmerksamkeit vor allem derjenigen, die diesen Weg weiter öffnen wollen. Prof. Dr. Dr. h.c. Helmut Schmalen Vorwort VII Vorwort Die vorliegende Arbeit entstand als Dissertation an der wirtschaftswissenschaftlichen Fakultät der Universität Passau. Sie wurde gefördert durch ein Stipendium des Freistaats Bayern nach dem Gesetz zur Förderung des wissenschaftlichen und künstlerischen Nachwuchses über die maximale Förderdauer von zwei Jahren. Einen weiteren Beitrag leistete die MTU Motoren und Turbinen-Union GmbH im Rahmen der der Universität Passau überlassenen Fördermittel. Hierftir bedanke ich mich ganz herzlich! Meinem akademischen Vater, Herrn Prof. Dr. Dr. h.c. Helmut Schmalen vom Lehrstuhl flir Betriebswirtschaftslehre mit Schwerpunkt Absatzwirtschaft und Handel an der Universität Passau, danke ich ftir die Betreuung und Begutachtung der Arbeit sowie das in mich gesetzte Vertrauen von ganzem Herzen. Frau Prof. Dr. Gertrud Moosmüller vom Lehrstuhl flir Statis tik an der Universität Passau danke ich flir die Übernahme des Zweitgutachtens. Mein Dank gilt ferner meinen Kollegen am Lehrstuhl flir Absatzwirtschaft und Handel flir die zahlreichen Diskussionen und Anregungen. Herrn Prof. Dr. Harald Hruschka bin ich flir den Kontakt mit Neuronalen Netzen zu Dank verpflichtet. Schließlich danke ich ganz besonders meiner Frau Jacqueline sowie meinen Eltern und Schwiegereltern, die durch ihre direkte und indirekte Unterstützung wesentlich zum Gelingen dieser Arbeit beigetragen haben. Adolf Zander Inhaltsverzeichnis IX Inhaltsverzeichnis Geleitwort .................................................................................................................................. V Vorwort ................................................................................................................................... VII Tabellenverzeichnis ................................................................................................................ XV Abbildungsverzeichnis ......................................................................................................... XVII Abkürzungsverzeichnis ......................................................................................................... XIX Einführung ........................................................................................................................ 1 1.1 Relevanz der Problemstellung ........................................................................................ 1 1.2 Zielsetzung der Arbeit. .................................................................................................... 2 1.3 Aufbau der Arbeit ........................................................................................................... 4 2 Strukturmodelle mit latenten Variablen ........................................................................ 7 2.1 Das Konzept der Latenten Variablen und ihres Meßmodells ......................................... 7 2.1.1 Begriffsbestimmung ................................................................................................ 7 2.1.2 Latente Variablen als Faktoren .............................................................................. I 0 2.1.3 Latente Variablen als Linearkombinationen ......................................................... 13 2.1.4 Latente Variablen als Hauptkomponenten ............................................................. 15 2.1.5 Vergleichende Beurteilung der LV -Konzepte ....................................................... 18 2.1.5.1 BeurteilungderLValsFaktor ........................................................................ 18 2.1.5.2 Beurteilung der LV als Linearkombination .................................................... 20 2.2 Strukturmodelle mit latenten Variablen ........................................................................ 22 2.2.1 Der Begriffd es Strukturmodells mit latenten Variablen ....................................... 22 2.2.2 Ansätze zur Schätzung von Strukturmodellen mit latenten Variablen als Linearkombinationen ....................................................................... 24 2.3 Fazit. .............................................................................................................................. 30 3 Der LISREL-Ansatz der Kovarianzstrukturanalyse als Referenz- methodik zur Schätzung von Strukturmodellen mit latenten Variablen .................. 31 3.1 Zielsetzung und Grundgedanke des LISREL-Ansatzes ................................................ 31 3.2 Die Analyse eines linearen SMLV im Rahmen des LISREL-Ansatzes ........................ 32 3.2.1 Modellspezifikation ............................................................................................... 32 3.2.2 Parameterschätzung ............................................................................................... 34 3.2.3 Überprüfung der Identifikation .............................................................................. 36 3.2.4 Beurteilung der Anpassungsgüte ........................................................................... 38 X Inhaltsverzeichnis 3.2.4.1 Güte des Gesamtmodells ................................................................................ 38 3.2.4.2 Güte von Modellteilen .................................................................................... 39 3.2.4.3 Güte der Parameterschätzungen ..................................................................... 40 3.3 Beurteilung des LISREL-Ansatzes zur Analyse von Strukturmodellen mit latenten Variablen ................................................................................................... 42 3.3.1 Vorteile .................................................................................................................. 42 3.3.2 Nachteile ................................................................................................................ 43 3.3.3 Abschließende Beurteilung .................................................................................... 46 3.4 Ansätze zur Analyse nichtlinearer Strukturmodelle mit latenten Variablen im Rahmen des LISREL-Ansatzes ............................................................... 47 3.4.1 Ansätze ftir Quadratterme ...................................................................................... 48 3.4.1.1 Regression mit einem Produktterm ................................................................ 48 3.4.1.2 Subgruppenanalyse ......................................................................................... 49 3.4.1.3 Indikatorproduktanalyse ................................................................................. 51 3.4.2 Der Ansatz von KENNY/Juoo ................................................................................ 51 3.4.3 Beurteilung des Ansatzes von KENNY/Juoo ......................................................... 52 3.5 Fazit.. ............................................................................................................................. 54 4 Das Multi-Layer-Perceptron und der Backpropagation-Algorithmus ..................... 55 4.1 Der Begriff des neuronalen Netzes ............................................................................... 55 4.2 Das Multi-Layer-Perceptron ......................................................................................... 56 4.2.1 Bestandteile eines Multi-Layer-Perceptrons .......................................................... 56 4.2.2 Begriff des Multi-Layer-Perceptrons ..................................................................... 58 4.2.3 Das heteroassoziative Multi-Layer-Perceptron ...................................................... 59 4.2.4 Beurteilung des Multi-Layer-Perceptrons .............................................................. 60 4.2.4.1 Approximationsfähigkeit und Underfit .......................................................... 61 4.2.4.2 Generalisierungsfähigkeit und Overfit ........................................................... 63 4.3 Der Backpropagation-Algorithmus ............................................................................... 69 4.3.1 Der Begriff des Lemens ......................................................................................... 70 4.3.2 Der Standard-Backpropagation-Algorithmus ........................................................ 71 4.3.3 Kritik am Backpropagation-Algorithmus .............................................................. 74 4.3.4 Modifikationen des Backpropagation-Algorithmus .............................................. 76 4.3.4.1 Modifikationen zur Vermeidung lokaler Minima .......................................... 77 4.3.4.2 Modifikationen für schnellere Konvergenz .................................................... 77 4.4 Bisherige Ansätze zur Analyse von SML V mit NN ..................................................... 79 4.4.1 Heteroassoziatives Multi-Layer-Perceptron zur Analyse von multiplen Regressionsmodellen mit latenten Variablen als Prädiktaren ............................... 80 Inhaltsverzeichnis XI 4.4.2 Autoassoziatives Multi-Layer-Perceptron zur Extraktion von Hauptkomponenten ....................................................................... 83 4.4.2.1 Linearer Fall ................................................................................................... 83 4.4.2.2 Nichtlinearer Fall... ......................................................................................... 86 4.5 Fazit. .............................................................................................................................. 87 5 Das autoassoziative MLP als neuer Ansatz zur Analyse von Struktur- modellen mit nichtlinearen Beziehungen zwischen den latenten Variablen ............. 89 5.1 Die Architektur des autoassoziativen Multi-Layer-Perceptrons zur Analyse von Strukturmodellen mit nichtlinearen Beziehungen zwischen den latenten Variablen .... 89 5.2 Hypothesen und Plausibilisierung des Ansatzes ........................................................... 91 5.3 Festlegung der Architektur.. .......................................................................................... 93 5.3.1 Biasunit ................................................................................................................. 93 5.3.2 Anzahl von Verbindungen und Neuronen in den (de-)mapping layers ................. 95 5.4 Wahl von Lernparametern ............................................................................................ 98 5.4.1 Lernrate .................................................................................................................. 99 5.4.2 Momentumparameter ........................................................................................... 100 5.4.3 Abbruchkriterien .................................................................................................. 101 5.4.4 Auswahl der Trainingsdaten und Epoch Size ...................................................... 101 5.4.5 Anfangsinitialisierung der Gewichte ................................................................... 103 5.5 Entscheidungen im Zusammenhang mit den Daten .................................................... 104 5.5.1 Umfang der Trainings- und Teststichprobe ......................................................... 104 5.5.2 Skalierung der Variablen ..................................................................................... 106 5.5.2.1 Normierung der Inputvariablen .................................................................... 107 5.5.2.2 Normierung der Outputvariablen ................................................................. 108 5.6 Fazit... .......................................................................................................................... 108 6 Aufbau und Durchführung der Simulationsstudie ................................................... 111 6.1 Der Begriff und Grundgedanke der Monte-Cario-Simulation .................................... 111 6.2 Literaturüberblick über relevante Monte-Carlo-Simulationen .................................... 113 6.2.1 Monte-Cario-Simulation in der Kovarianzstrukturanalyse .................................. 113 6.2.2 Monte-Cario-Simulation flir Neuronale Netze .................................................... 114 6.3 Ziele und Aufbau der Simulationsstudie ..................................................................... 114 6.4 Festlegung des Untersuchungsdesigns ........................................................................ 116 6.4.1 Rahmenbedingungen der Simulation ................................................................... 117 6.4.2 Faktoren des Experiments .................................................................................... 120 6.4.2.1 Beziehungsart im Strukturmodell... .............................................................. 120 6.4.2.1.1 Linear ........................................................................................................ 121

Description:
Adolf Zander entwickelt eine spezielle Architektur des autoassoziativen Multi-Layer-Perceptrons zur Schätzung eines Modells mit beliebigen nichtlinearen Beziehungen zwischen zwei latenten Variablen.
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.