Methods for Diagnosis and Interpretation of Stochastic Actor-oriented Models for Dynamic Networks Dissertation zur Erlangung des akademischen Grades Doktor der Naturwissenschaften (Dr. rer. nat.) vorgelegt von Natalie Indlekofer an der Mathematisch-Naturwissenschaftliche Sektion Fachbereich Informatik & Informationswissenschaft Tag der mu¨ndlichen Pru¨fung: 4. Februar 2014 Erster Referent: Ulrik Brandes Zweite Referentin: Tom A.B. Snijders Deutsche Zusammenfassung Der Begriff soziales Netzwerk ist heutzutage allgegenw¨artig. In dieser Dissertation bezieht er sich auf ein System, das aus einer Gruppe sozialer Akteure und Ver- bindungen zwischen diesen besteht. Beispiele sind Freundschaften innerhalb einer Schulklasse oder Handelsabkommen zwischen einer Gruppe von Staaten. Intuitiv l¨asst sich vermuten, dass sich Verbindungen in sozialen Netzwerken gegenseitig be- dingen. Die Soziale Netzwerkanalyse untersucht diese Abh¨angigkeitsstruktur zwi- schen Verbindungen in sozialen Netzwerken. In dieser Arbeit werden soziale Netzwerke betrachtet, die sich mit der Zeit entwi- ckeln. Dabei interessiert uns, in welcher Weise zuku¨nftige Ver¨anderungen im Netz- werk von der aktuellen Netzwerkstruktur abh¨angen. Das zentrale Element ist ein statistisches Modell zur akteursbasierten Modellierung dynamischer Netzwerkda- ten. Es wurde von Snijders (1996) eingefu¨hrt und wird u¨blicherweise als stochastic actor-oriented model (SAOM) bezeichnet. Das SAOM wurde fu¨r die statistische Analyse von Netzwerkpaneldaten entwickelt und ist die meistverbreitete Analyse- methode fu¨r dieses Datenformat. Ziel der Modellierung ist die Identifizierung lokaler netzwerkspezifischer Mechanismen, sogenannter Netzwerkeffekte, die den Entwick- lungsprozess des Netzwerks zwischen aufeinanderfolgenden Erhebungszeitpunkten bestimmen. Die Entwicklung des gesamten Netzwerks wird dabei als Folge von Ver¨anderungen einzelner Verbindungen beschrieben und als parametrisierte zeit- kontinuierliche Markoff-Kette modelliert. Das SAOM repr¨asentiert eine akteursba- sierte Perspektive, indem es A¨nderungen von Verbindungen als Folge individueller Akteursentscheidungen modelliert. ZieldieserDissertationistes,MethodenzurUnterstu¨tzungderakteursbasiertenMo- dellierung dynamischer Netzwerke bereitzustellen. Dabei werden zwei thematische Schwerpunkte verfolgt: 1. Das SAOM ist eines der wenigen Netzwerkmodelle, die sich zur statistischen Inferenz eignen. Allerdings ist die Interpretierbarkeit der abgeleiteten Ergeb- nisse durch die Komplexit¨at des Modells erschwert. Derzeitige Analysen be- schr¨anken sich auf Hypothesentests zur Bestimmung der statistischen Signifi- i kanz betrachteter Effekte. Die St¨arke einzelner Effekte bleibt dagegen weitest- gehend unberu¨cksichtigt, da es fu¨r SAO Modelle bisher kein etabliertes Maß zur Bewertung relativer Effektst¨arken gibt. Ein solches Maß wird in dieser Arbeit eingefu¨hrt. Es basiert auf dem relativen Einfluss der Effekte auf Akteursentscheidungen und beru¨cksichtigt sowohl die Werte der Modellparameter als auch die untersuchten Daten und die gesamte Modellspezifikation. Dadurch erlaubt es den Vergleich relativer Effektst¨arken innerhalb eines Modells sowie fu¨r unterschiedliche Modelle und fu¨r verschiede- ne Datens¨atze. Diese Vergleichbarkeit erleichtert die Interpretation und Kom- munikation der inferentiell erhaltenen Ergebnisse. 2. Um die statistische Beherrschbarkeit des Modells zu gew¨ahrleisten, werden ei- nigevereinfachendeAnnahmengetroffen,daruntereineHomogenit¨atsannahme hinsichtlich des Verhaltens der Akteure, die impliziert, dass lokale Netzwerk- mechanismen fu¨r alle Akteure in gleicher Weise gelten. In vielen F¨allen scheint diese Verallgemeinerung ungerechtfertigt und m¨ogliche Ursache fu¨r verf¨alschte Ergebnisse zu sein. Im Folgenden werden diagnostische Methoden zur Validierung dieser Homoge- nit¨atsannahme eingefu¨hrt. Misslingt die Validierung, unterstu¨tzen diagnosti- sche Maßzahlen die Evaluierung existierender Inhomogenit¨aten und die Iden- tifizierung einzelner Ausreißer oder Gruppen von Akteuren, deren Verhalten von den vom Modell erwarteten Verhaltensweisen abweicht. Eine erste Me- thode findet abweichende Akteure durch die Analyse der U¨bereinstimmungen zwischen beobachteten und vom Modell erfassten Ver¨anderungen lokaler Netz- werkkonfigurationen einzelner Akteure. Eine zweite Methode dient speziell zur Identifizierung von Akteuren, deren abweichendes Verhalten die Param- tersch¨atzung stark beeinflusst. Das Auffinden solcher einflussreicher Akteure ist insbesondere wichtig, da ihr Einfluss zu verf¨alschten Ergebnisses fu¨hren kann. Die eingefu¨hrten diagnostischen Maßzahlen approximieren die Sensiti- vit¨atderSch¨atzergebnisseauflokaleSt¨orungenderzurSch¨atzungverwendeten Netzwerkdaten. Die Arbeit ist in vier Kapitel unterteilt: Kapitel 1 gibt einen U¨berblick u¨ber analy- tische Konzepte und Modelle der statistischen Netzwerkanalyse. In Kapitel 2 wird das zentrale Modell, das stochastic actor-oriented model (SAOM), eingefu¨hrt. Kapi- tel 3 beinhaltet die Herleitung eines Maßes zur Bewertung relativer Effektst¨arken in SAO Modellen, und Kapitel 4 besch¨aftigt sich mit der Entwicklung diagnostischer Methoden zur Evaluierung von Homogenit¨atsannahmen hinsichtlich des Verhaltens der Akteure im Netzwerk. Die Arbeit endet mit einer Diskussion der Ergebnisse und m¨oglicher zuku¨nftiger Forschungsfragen. ii Acknowledgements First and foremost, I would like to thank my advisor Ulrik Brandes for his guidance, his constant support, and for everything I have learned from him. I have benefited greatly from his wide knowledge and his inspiring enthusiasm for research, and I am very grateful for the many opportunities he opened up to me. The attendance at several scientific meetings all over the world, a research visit lasting several month, and the flexibility to work partly from Stuttgart are only some examples. I am extremely grateful to Tom Snijders for being my second referee and for inviting me as a research visitor. The month in Oxford have been a great experience and crucial for large parts of my research. Thank you very much for the many motivat- ing and fruitful discussions and ideas. I also want to thank Viviana Amati and Christian Steglich for helpful discussions and important comments on my work as well as Sven Kosub and Marc Scholl for joining my examination committee. Many thanks go to all my colleagues from the algorithmics group and all the people from E2 for their support, collaboration, and friendship, and for making my years in Konstanz very special. I am deeply grateful to my family, most of all my parents Katja and Markus In- dlekofer and my brother Julian, for their stable and absolute support through all these years. Finally, I want to thank my wonderful partner Thomas Mundinger for all the love and strength he gave me. Without his encouragement, his endless patience, and his unfailing support, this dissertation would not have been possible. Thank you! Natalie Indlekofer February 2014 iii Contents Introduction 1 1 Statistical Analysis of Network Data 5 1.1 Basic Concepts and Terminology . . . . . . . . . . . . . . . . . . . . . . . 7 1.2 Typical Dependencies in Networks . . . . . . . . . . . . . . . . . . . . . . 10 1.3 Statistical Modeling of Social Networks . . . . . . . . . . . . . . . . . . . 13 1.3.1 Statistical Inference in Empirical Research. . . . . . . . . . . . . 13 1.3.2 Models for Cross-sectional Network Data. . . . . . . . . . . . . . 19 1.4 Statistical Models for Network Panel Data . . . . . . . . . . . . . . . . . 23 1.4.1 Continuous-time Markov Processes . . . . . . . . . . . . . . . . . 24 1.4.2 Dyad-Independence Models . . . . . . . . . . . . . . . . . . . . . . 28 2 Stochastic Actor-oriented Models 33 2.1 Formulation of the Model . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.1.1 Model Assumptions. . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.1.2 Actor Decisions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 2.1.3 Timing of Network Changes. . . . . . . . . . . . . . . . . . . . . . 38 2.1.4 Model Specification. . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.2 Parameter Estimation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 2.2.1 Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 2.2.2 Method of Moments . . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.3 Model Selection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 2.3.1 Significance Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 v 3 Relative Importance of Effects in SAOMs 55 3.1 Relative Importance in Regression Models . . . . . . . . . . . . . . . . . 57 3.2 How to Define Relative Importance in a SAOM? . . . . . . . . . . . . . 59 3.2.1 How to Assess Relative Importance in a Micro-step?. . . . . . . 60 3.2.2 Main Difficulties. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 3.3 A Measure of Relative Importance . . . . . . . . . . . . . . . . . . . . . . 63 3.3.1 Relative Impact on Actor Decisions . . . . . . . . . . . . . . . . . 63 3.3.2 Relative Impact on Network Evolution . . . . . . . . . . . . . . . 66 3.3.3 Computational Costs. . . . . . . . . . . . . . . . . . . . . . . . . . 68 3.4 Application to a Network of University Freshmen. . . . . . . . . . . . . 69 3.4.1 Model Specification and Estimation Results . . . . . . . . . . . . 70 3.4.2 Relative Importance at Observation Moments. . . . . . . . . . . 72 3.4.3 Dynamics of Relative Importance . . . . . . . . . . . . . . . . . . 78 3.5 Discussion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 4 Discovering Actor Inhomogeneity in SAOMs 89 4.1 Example Data: Friendships in a School Class . . . . . . . . . . . . . . . 91 4.2 Detecting Outliers and Deviating Groups. . . . . . . . . . . . . . . . . . 92 4.2.1 Local Fit of Individual Actors . . . . . . . . . . . . . . . . . . . . 92 4.2.2 Visual Exploration of Local Fit. . . . . . . . . . . . . . . . . . . . 100 4.3 Influence of Individuals on Estimates . . . . . . . . . . . . . . . . . . . . 102 4.3.1 Deletion of Single Cases to Assess their Influence. . . . . . . . . 103 4.3.2 What is a Single Case in a SAOM? . . . . . . . . . . . . . . . . . 105 4.4 Incorporate Perturbations into Estimating Functions. . . . . . . . . . . 106 4.4.1 Discrete Perturbations for Single Influential Actors. . . . . . . . 107 4.4.2 Continuous Perturbations for Groups of Influential Actors . . . 108 4.5 Sensitivity of Estimates towards Local Perturbations. . . . . . . . . . . 109 4.6 Directions of Maximum Sensitivity. . . . . . . . . . . . . . . . . . . . . . 111 4.6.1 Sensitivity of Single Parameters . . . . . . . . . . . . . . . . . . . 111 4.6.2 Aggregated Sensitivity of All Parameters. . . . . . . . . . . . . . 117 4.7 Discussion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119 vi Conclusion 123 Bibliography 125 vii
Description: