Jürgen Malitte Sven Schreiber Ökonometrie verstehen mit Gretl Eine Einführung mit Anwendungs beispielen Ökonometrie verstehen mit Gretl Jürgen Malitte · Sven Schreiber Ökonometrie verstehen mit Gretl Eine Einführung mit Anwendungsbeispielen Jürgen Malitte Sven Schreiber Solingen, Deutschland Berlin, Deutschland ISBN 978-3-662-58274-9 ISBN 978-3-662-58275-6 (eBook) https://doi.org/10.1007/978-3-662-58275-6 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detail- lierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer Gabler © Springer-Verlag GmbH Deutschland, ein Teil von Springer Nature 2019 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Springer Gabler ist ein Imprint der eingetragenen Gesellschaft Springer-Verlag GmbH, DE und ist ein Teil von Springer Nature Die Anschrift der Gesellschaft ist: Heidelberger Platz 3, 14197 Berlin, Germany Vorwort DerBegriff„Ökonometrie“wurdevonRagnarFrischundJosephSchumpeterEndederzwan- ziger Jahre entwickelt und führte zur Gründung der „Econometric Society“ im Jahr 1930. DieseGesellschaftgibtseit1933auchdieZeitschrift„Econometrica“heraus,inderwegwei- sendeArbeitenveröffentlichtwurden. ÖkonometrischeMethoden(wozuvorallemdieRegressionsanalysezählt)werdenu.a.in derVolks-undBetriebswirtschaftslehreverwendet.DieVerfügbarkeitumfangreicherDaten- mengen aus dem wirtschafts- und gesellschaftswissenschaftlichen Bereich ermöglicht die empirische (datengestützte) Analyse von vermuteten Beziehungen zwischen Ursache und Wirkung,derenPlausibilitätuntersuchtundmitHilfeökonometrischerSoftwarepaketeent- wedervalidiertoderverworfenwerdenkann. Die Auswahl an entsprechender Software ist groß. Die Autoren haben sich schließlich für die Software Gretl entschieden, die als Open Source frei im Internet verfügbar ist und sehr viele Schätz- und Testverfahren der Ökonometrie beeinhaltet. Aus dem Open Source- Konzept ergibt sich eine breite Unterstützung in der Weiterentwicklung und Verbesserung derSoftware. Der Name Gretl ist ein Akronym für Gnu Regression, Econometrics and Time-series Library. Initiator und einer der hauptverantwortlichen Autoren von Gretl ist Allin Cottrell, ProfessorfürWirtschaftswissenschaftanderWakeForestUniversity,NorthCarolina(USA). DieseEinführungindieÖkonometrieistdahergleichzeitigeineEinführungindieHand- habungvonGretl,genauer:indieHandhabungdergrafischenBenutzeroberflächeundinden Umgang mit einer mächtigen Skriptsprache namens Hansl, die alle wesentlichen Stilmittel einerherkömmlichenProgrammiersprachebeinhaltet,aberdennochleichtzuerlernenist.Die wesentlichenökonometrischenKonzeptewerdendabeidirektinGretlumgesetztunddurch vieleBeispieleerläutert. GretlbesitzteinesehrbenutzerfreundlichegrafischeOberfläche,dieinverschiedenenSpra- chenverfügbarist.ZusätzlichstehteineSkriptsprachezurVerfügung,mitderderBenutzer sehrflexibleAuswertungendesDatenbestandsvornehmenkann. Um den Leser/die Leserin hinsichtlich der Erwartungen an dieses Buch nicht zu enttäu- schen, soll kurz dargestellt werden, was dieses Buch leistet bzw. was es nicht leisten kann. ZunächstdarfkeineausführlicheBeschreibungdergesamtenangebotenenFunktionalitäter- wartet werden, die Gretl bietet. Dazu wird auf das Handbuch und die Befehls- bzw. Funk- tionsreferenzinenglischerSpracheverwiesen.DasBuchsolldenLeser/dieLeserinaberin den Stand versetzen, die grundlegenden Konzepte der Ökonometrie zu verstehen und unter HeranziehungdervonGretlangebotenenWerkzeugezubearbeiten. DasBuchrichtetsichandiejenigen,diealsStudenten/Studentinnenderwirtschaftswissen- schaftlichen Fachrichtungen eine Vorlesung zur Ökonometrie besuchen oder bereits Kennt- vi Vorwort nisseüberdieGrundlagenderÖkonometriebesitzenundeinegeeigneteSoftwarefürregres- sionsanalytischeUntersuchungeneinsetzenwollen. Das vorliegende Buch ist in zwei Teile aufgeteilt. Der erste Teil vermittelt die grundle- genden Basiskenntnisse im Umgang mit Gretl. Dazu gehört die Vorstellung der grafischen Benutzeroberfläche(GUI)undeineEinführungindieSkriptsprachemitihrenverschiedenen DatentypenundKontrollstrukturen.AußerdemwerdeneinigewichtigeAspekteimHinblick aufdieBearbeitungvonDatenbeständenthematisiert,wobeiderenunterschiedlicheStruktur berücksichtigtwird(Querschnittsdaten,ZeitreihenundPanels). Der zweite Teil behandelt die klassischen Themengebiete der Ökonometrie, beginnend mit dem einfachen Regressionsmodell. Anschließend wird das multiple Regressionsmodell vorgestellt, wobei im Haupttext auf eine matrixbezogene Notation verzichtet wird. Der Be- handlung von Matrizen im allgemeinen und innerhalb von Gretl ist im Anhang ein eigenes Kapitel gewidmet. Dies erscheint angebracht, weil Gretl viele Werkzeuge zur Verarbeitung von Matrizen anbietet. Ökonometrie ist nicht allein auf die Analyse von Querschnittsdaten beschränkt, sondern umfasst auch die Analyse von Zeitreihen und Paneldaten. Aus diesem GrundwurdenzusätzlicheKapitelzudiesenThemenkreiseninsBuchaufgenommen. AnvielenStellenwerdenQuerverweiseinderForm„+sieheAbschnitt<Abschnittsnum- mer>“ aufgenommen. Sie verweisen den Leser/die Leserin auf andere Stellen im Buch, an deneneinbestimmterGedankengangweitergeführtwird,weileranderaktuellenStellenicht vertieftdargestelltwerdenkann. DieAutorenhoffen,mitdieserKonzeptionzueinerIntegrationvonökonometrischerMetho- denausbildung und datenorientierter Umsetzung beizutragen und wünschen den Leserinnen undLesernvielSpaßbeiderLektüresowieErfolgbeiderAnwendung. SolingenundBerlin,2019 Inhaltsverzeichnis Vorwort v I. EinführungindenUmgangmitGretl 1 1. ErsteSchritte–Datentypen–Kommandosprache 3 1.1 DieInstallation . . . . . . . . . . . . . . . . . . . . . 3 1.2 DurchführungeinerGretl-Sitzung . . . . . . . . . . . . . . . 6 1.3 DieKommandosprache . . . . . . . . . . . . . . . . . . 18 1.3.1 DerGretl-Skripteditor . . . . . . . . . . . . . . . . 19 1.3.2 SyntaxregelnderKommandosprache . . . . . . . . . . . 22 1.4 DatentypenundKontrollstrukturen . . . . . . . . . . . . . . 25 1.4.1 scalar . . . . . . . . . . . . . . . . . . . . . 25 1.4.2 KontrollstrukturVerzweigung(if) . . . . . . . . . . . . 27 1.4.3 series. . . . . . . . . . . . . . . . . . . . . . 29 1.4.4 KontrollstrukturWiederholung(loop) . . . . . . . . . . . 34 1.4.5 list . . . . . . . . . . . . . . . . . . . . . . 39 1.4.6 matrix . . . . . . . . . . . . . . . . . . . . . 44 1.4.7 string. . . . . . . . . . . . . . . . . . . . . . 48 1.4.8 bundle . . . . . . . . . . . . . . . . . . . . . 50 1.4.9 ArbeitenmitArrays. . . . . . . . . . . . . . . . . 51 2. VomUmgangmitDatasets 53 2.1 DieStrukturvonDatasets–Querschnitte,Zeitreihen,Panels . . . . . . 53 2.1.1 Querschnittsdaten . . . . . . . . . . . . . . . . . 54 2.1.2 Zeitreihendaten . . . . . . . . . . . . . . . . . . 54 2.1.3 Paneldaten . . . . . . . . . . . . . . . . . . . . 56 2.1.4 DateneingabeüberdasGretl-Spreadsheet. . . . . . . . . . 58 2.2 ImportierenvonDaten. . . . . . . . . . . . . . . . . . . 62 2.2.1 DatenimportüberdiegrafischeOberfläche . . . . . . . . . 63 2.2.2 DatenimportundBearbeitungderDatenstrukturimSkript . . . . 68 2.2.3 ErweiternundZusammenführenvonDatasetsmitjoin . . . . . 74 2.3 BearbeitungvonDatasets. . . . . . . . . . . . . . . . . . 85 2.3.1 StatistischeKennzahlenvonDatasetvariablen . . . . . . . . 86 2.3.2 AggregierteAuswertungen . . . . . . . . . . . . . . 89 2.3.3 DerUmgangmitfehlendenWerten. . . . . . . . . . . . 92 2.3.4 AuswahlvonTeilstichproben(subsampling). . . . . . . . . 94 viii Inhaltsverzeichnis 2.3.5 DiskreteDatasetvariablenundderenVerarbeitung . . . . . . . 100 2.4 DieErstellungvonGrafiken. . . . . . . . . . . . . . . . . 104 2.4.1 Boxplot . . . . . . . . . . . . . . . . . . . . . 105 2.4.2 Streudiagramme . . . . . . . . . . . . . . . . . . 108 2.4.3 Häufigkeitsdiagramme . . . . . . . . . . . . . . . . 109 2.4.4 GrafikerzeugungmitdemKommandognuplot . . . . . . . . 111 3. DieGretl-Sitzung 115 3.1 KomponentenderGretl-Sitzung . . . . . . . . . . . . . . . 115 3.2 VerwaltungderSitzungsdateninderSymbolansicht . . . . . . . . . 117 3.3 VerwaltungvonSitzungsdatenimSkript. . . . . . . . . . . . . 121 II. DieAnalyseökonometrischerModellemitGretl 123 4. RegressionsanalysevonQuerschnittsdaten 125 4.1 ModellbildunginderÖkonometrie . . . . . . . . . . . . . . 125 4.2 DaseinfachelineareRegressionsmodell . . . . . . . . . . . . . 128 4.2.1 DefinitiondesModellsundBegriffsbildung . . . . . . . . . 128 4.2.2 SchätzungderParametermitderKQ-Methode . . . . . . . . 132 4.2.3 AnalyseundAuswertungderModellschätzung . . . . . . . . 142 4.2.4 WahrscheinlichkeitsverteilungenderKQ-Schätzer. . . . . . . 145 4.2.5 IntervallschätzungdesParametersb . . . . . . . . . . . 155 4.2.6 SignifikanzderKQ-Schätzer–Hypothesentest . . . . . . . . 166 4.2.7 GütederModellanpassung:dasBestimmtheitsmaß . . . . . . 171 4.2.8 GrundannahmendeseinfachenlinearenRegressionsmodells . . . 176 4.2.9 UnverzerrtheitundEffizienzderKQ-Schätzer . . . . . . . . 181 4.3 NichtlineareModelleundTransformationenvonVariablen. . . . . . . 184 4.3.1 LinearitätundNichtlinearität. . . . . . . . . . . . . . 185 4.3.2 ModellemitlogarithmischenTransformationen. . . . . . . . 186 4.3.3 ModellemitpolynomialerStruktur . . . . . . . . . . . . 198 4.4 DasmultiplelineareRegressionsmodell . . . . . . . . . . . . . 201 4.4.1 EigenschaftendesmultiplenRegressionsmodells . . . . . . . 202 4.4.2 SchätzungvonModellenmitmehrerenRegressoren . . . . . . 206 4.4.3 KQ-SchätzungenmitDummyvariablen . . . . . . . . . . 208 4.4.4 AutonomeVariationundBestimmtheitsmaß . . . . . . . . . 215 4.4.5 GrundannahmendesmultiplenRegressionsmodells . . . . . . 221 4.4.6 ErwartungswertundVarianzderKQ-Schätzeraˆ undbˆ . . . . . 223 i 4.4.7 HypothesentestimmultiplenRegressionsmodell . . . . . . . 229 4.4.8 KonfidenzintervalleundKonfidenzellipse. . . . . . . . . . 238 Inhaltsverzeichnis ix 5. ProblemederModellbildungundMaßnahmenzurQualitätssteigerung 243 5.1 DieAnalysedesgeschätztenModells. . . . . . . . . . . . . . 243 5.1.1 KollinearitätderRegressorenundAuslassenrelevanterVariablen. . 245 5.1.2 MaßzahlenderModellgüteundModellselektion . . . . . . . 251 5.1.3 EinflussreicheBeobachtungen . . . . . . . . . . . . . 255 5.1.4 TestszurUntersuchungderSpezifikationvonModellen . . . . . 259 5.1.4.1 EinFehlspezifikationstest–RamseysRESET-Test . . . . . 261 5.1.4.2 TestaufStrukturbrüche–DerChow-Test . . . . . . . . 264 5.2 TestszudenModellannahmen . . . . . . . . . . . . . . . . 272 5.2.1 NormalverteilungderStörgrößen . . . . . . . . . . . . 272 5.2.2 HeteroskedastizitätderStörgrößen . . . . . . . . . . . . 275 5.2.3 White-Test . . . . . . . . . . . . . . . . . . . . 278 5.2.4 SchätzverfahrenbeimAuftretenvonHeteroskedastizität . . . . . 283 5.3 EndogenitätvonRegressoren . . . . . . . . . . . . . . . . 288 5.3.1 UrsachenfürdasAuftretenvonEndogenität. . . . . . . . . 289 5.3.2 EndogenitätundInstrumentvariablenschätzung(IV) . . . . . . 292 5.3.2.1 GrundideederIV-Schätzung . . . . . . . . . . . . 292 5.3.2.2 EigenschaftenderIV-Schätzer. . . . . . . . . . . . 295 5.3.2.3 DasallgemeineIV-Regressionsmodell . . . . . . . . . 305 5.3.2.4 TestderInstrumenteundHausman-Test . . . . . . . . 310 5.3.3 SimultaneökonometrischeModelle. . . . . . . . . . . . 313 6. RegressionsanalysevonZeitreihen 321 6.1 GrundkonzeptederZeitreihenanalyse. . . . . . . . . . . . . . 322 6.2 AutokorrelationderStörgrößen. . . . . . . . . . . . . . . . 324 6.2.1 EinführendesBeispiel:ZusammenhangBIPundArbeitslosigkeit . . 325 6.2.2 DerautoregressiveProzessderStörgrößen . . . . . . . . . 331 6.2.3 DerDurbin-Watson-Test . . . . . . . . . . . . . . . 333 6.2.4 DerBreusch-Godfrey-Test. . . . . . . . . . . . . . . 335 6.2.5 SchätzverfahrenbeimAuftretenvonAutokorrelation . . . . . . 337 6.3 BesonderheitenvonZeitreihen . . . . . . . . . . . . . . . . 342 6.3.1 StationäreProzesse . . . . . . . . . . . . . . . . . 342 6.3.2 NichtstationäreProzesse . . . . . . . . . . . . . . . 344 6.3.2.1 Saisonmuster . . . . . . . . . . . . . . . . . 345 6.3.2.2 ZeitreihenmiteinemstochastischenTrend. . . . . . . . 347 6.3.2.3 ZeitreihenmiteinemdeterministischenTrend. . . . . . . 351 6.3.2.4 EliminiereneinesTrends . . . . . . . . . . . . . 355 6.3.2.5 DasProblemderScheinregression . . . . . . . . . . 359 6.3.3 TestsaufEinheitswurzel–(erweiterter)Dickey-Fuller-Test . . . . 361 6.3.4 KointegrationzwischennichtstationärenZeitreihen . . . . . . 367 6.4 ModellemitzeitlichverzögertenRegressoren . . . . . . . . . . . 375 6.4.1 Modelle mit Verzögerungen der endogenen und erklärenden Varia- blen(ARDL) . . . . . . . . . . . . . . . . . . . 375 x Inhaltsverzeichnis 6.4.2 Fehlerkorrekturmodelle(ECM) . . . . . . . . . . . . . 382 7. RegressionsanalysevonPanel-Daten 389 7.1 SchätzungvonPanelmodellen . . . . . . . . . . . . . . . . 389 7.2 DasFixed-Effects-Modell . . . . . . . . . . . . . . . . . 395 7.3 DasRandom-Effects-Modell . . . . . . . . . . . . . . . . 401 III.Anhang 407 A. MatrixbasierteDarstellungderallgemeinenRegressionsanalyse 409 A.1 GrundlagenderMatrixbearbeitung. . . . . . . . . . . . . . . 409 A.2 MatrixbearbeitunginGretl . . . . . . . . . . . . . . . . . 417 A.3 MatrixnotationdesallgemeinenRegressionsmodells. . . . . . . . . 422 A.3.1 ParameterschätzerundderenVarianzen . . . . . . . . . . 423 A.3.2 HeteroskedastizitätderStörgrößen . . . . . . . . . . . . 432 A.3.3 AutokorrelationderStörgrößen . . . . . . . . . . . . . 437 A.3.4 EndogenitätvonRegressoren. . . . . . . . . . . . . . 442 B. ÜbersichtderGretl-FunktionenundKommandos 445 B.1 AllgemeineKommandos . . . . . . . . . . . . . . . . . . 445 B.2 MathematischeundstatistischeFunktionen. . . . . . . . . . . . 447 B.3 VerarbeitungvonZeichenketten . . . . . . . . . . . . . . . 450 B.4 KommandosundFunktionenfürDatasets . . . . . . . . . . . . 452 B.5 MatrixbezogeneFunktionen. . . . . . . . . . . . . . . . . 461 B.6 ModellbezogeneFunktionen. . . . . . . . . . . . . . . . . 464 B.7 KommandosfürdieDurchführungvonTests . . . . . . . . . . . 466 B.8 KommandosfürdieDurchführungvonSchätzungen. . . . . . . . . 468 B.9 FunktionspaketevonanderenNutzern . . . . . . . . . . . . . 469 C. StatistischeVerteilungenundTabellen 471 C.1 Normal-,Chi-Quadrat-,t-undF-Verteilungen . . . . . . . . . . . 471 C.2 Dickey-FullerundEngle-GrangerkritischeWerte. . . . . . . . . . 476 D. VerwendeteDatasets 477 Literatur 479 Index 481