Big Data für ökonomische Analysen Barbara Engels [email protected] @BarEngels 19. Oktober 2016, Köln Big Data für ökonomische Analysen Agenda ► 1. Big Data für ökonomische Analysen: Einleitung 2. Datenquellen 2.1 Open Data ► 2.2 Das Internet als Datenquelle 2.3 Crawlen: Logisch, aber nicht trivial ► 3. Arten der Datenanalyse 4. Beispiele 4.1 Use Case I: Nowcasting ► 4.2 Use Case II: Text Mining / Sentiment Analysis 4.3 Use Case III: Web Scraping für CPI ► 5. Grenzen der Big-Data-Analyse 2 Big Data für ökonomische Analysen Volume Velocity Variety Veracity Value 3 Big Data für ökonomische Analysen Datenquellen Datenquellen für ökonomische Big-Data-Analysen, in Prozent (n=111) Small-Scale Survey 4% Soziale Medien 7% Kommerzielle Daten/Konsumentendaten Administrative Daten 9% 35% Large-Scale Survey 11% Statistikbüros Sensorbasierte Daten 22% 13% Quelle: Technopolis/Oxford Internet Institute/CEPS, 2015; eigene Darstellung 4 Big Data für ökonomische Analysen Open Data Beispiele https://www.govdata.de/ https://data.europa.eu/euodp/de/data/ http://transparenz.hamburg.de/open-data/ https://daten.berlin.de/ http://data.deutschebahn.com/ … 5 Big Data für ökonomische Analysen Das Internet als Datenquelle Die Krux des Datensammelns und Datenaufbereitens ► Dumps: Daten, die öffentlich und gebündelt bereitgestellt werden • Analogie: Kopie der öffentlichen Buchhaltung nach Hause nehmen • Problem: u.U. fehlerhaft, nicht aktuell, selektiv ► Application Programming Interface (API): Daten über speziellen Zugang laden • Analogie: Schlüssel zum öffentlichen Teil der Buchhaltung • Problem: jede API ist eigenes Programmieruniversum, selektiv ► Scrapen: Daten von Webseite auslesen • Analogie: Schaufenster abfotografieren • Problem: Snapshot; läuft bei Umstrukturierung ins Leere; Botstopper 6 Big Data für ökonomische Analysen Crawlen: Logisch, aber nicht trivial 1. Liste mit zu durchsuchenden Webseiten erstellen 2. Im Seitenquelltext nach gewünschten Daten suchen 3. Coden (R, Java): Ziehe mir von jeder Seite der Liste diese Daten raus und lege sie ab 4. Datenaufbereitung (!) 5. Business as usual: Ökonometrie 7 Big Data für ökonomische Analysen Arten der Datenanalyse Genutzte Analysetools, in Prozent (n=58) Deskriptive Analyse Trendanalyse Andere (?) Profiling Textanalyse Vorhersage Stimmungserkennung Benchmarking Agentenbasierte Modellierung 0 10 20 30 40 50 60 70 80 Quelle: Technopolis/Oxford Internet Institute/CEPS, 2015; eigene Darstellung 8 Big Data für ökonomische Analysen Use Case I: Nowcasting ► Early estimate ► Datenquellen: Google-Suchanfragen, soziale Medien (Twitter, Blogs), Wikipedia- Suchen ► Anwendung: z.B. Arbeitsmarktökonomik ► Problem: Bias ► Beispiele: Arbeitslosenrate in Finnland, Lebensmittelpreise in Indonesien, Business Cycles über Mautgebühren ► Tuhkuri, J., 2014, Big data: Google Searches Predict Unemployment in Finland, https://www.etla.fi/en/publications/33195/ ► UN Global Pulse, 2014, Nowcasting Food prices in Indonesia using Social Media Signals, Global Pulse Project Series No. 1, http://www.unglobalpulse.org/sites/default/files/UNGP_ProjectSeries_Nowcasting_Food_Prices_2014.pdf ► Askitas, N. / Zimmermann, K.F., 2009, Google Econometrics and Unemployment Forecasting, Applied Economics Quarterly, Jg. 55, Nr. 2, S. 107–120, http://ftp.iza.org/dp4201.pdf ► Askitas, N. / Zimmermann, K.F., 2011, Nowcasting Business Cycles Using Toll Data, IZA Discussion Paper Nr. 5522, http://ftp.iza.org/dp5522.pdf 9 Big Data für ökonomische Analysen Nowcasting: Arbeitslosenrate in Finnland Quelle: Tuhkuri, 2014 10
Description: