Table Of ContentMethods for Diagnosis and Interpretation
of Stochastic Actor-oriented Models
for Dynamic Networks
Dissertation
zur Erlangung des akademischen Grades
Doktor der Naturwissenschaften
(Dr. rer. nat.)
vorgelegt von
Natalie Indlekofer
an der
Mathematisch-Naturwissenschaftliche Sektion
Fachbereich Informatik & Informationswissenschaft
Tag der mu¨ndlichen Pru¨fung: 4. Februar 2014
Erster Referent: Ulrik Brandes
Zweite Referentin: Tom A.B. Snijders
Deutsche Zusammenfassung
Der Begriff soziales Netzwerk ist heutzutage allgegenw¨artig. In dieser Dissertation
bezieht er sich auf ein System, das aus einer Gruppe sozialer Akteure und Ver-
bindungen zwischen diesen besteht. Beispiele sind Freundschaften innerhalb einer
Schulklasse oder Handelsabkommen zwischen einer Gruppe von Staaten. Intuitiv
l¨asst sich vermuten, dass sich Verbindungen in sozialen Netzwerken gegenseitig be-
dingen. Die Soziale Netzwerkanalyse untersucht diese Abh¨angigkeitsstruktur zwi-
schen Verbindungen in sozialen Netzwerken.
In dieser Arbeit werden soziale Netzwerke betrachtet, die sich mit der Zeit entwi-
ckeln. Dabei interessiert uns, in welcher Weise zuku¨nftige Ver¨anderungen im Netz-
werk von der aktuellen Netzwerkstruktur abh¨angen. Das zentrale Element ist ein
statistisches Modell zur akteursbasierten Modellierung dynamischer Netzwerkda-
ten. Es wurde von Snijders (1996) eingefu¨hrt und wird u¨blicherweise als stochastic
actor-oriented model (SAOM) bezeichnet. Das SAOM wurde fu¨r die statistische
Analyse von Netzwerkpaneldaten entwickelt und ist die meistverbreitete Analyse-
methode fu¨r dieses Datenformat. Ziel der Modellierung ist die Identifizierung lokaler
netzwerkspezifischer Mechanismen, sogenannter Netzwerkeffekte, die den Entwick-
lungsprozess des Netzwerks zwischen aufeinanderfolgenden Erhebungszeitpunkten
bestimmen. Die Entwicklung des gesamten Netzwerks wird dabei als Folge von
Ver¨anderungen einzelner Verbindungen beschrieben und als parametrisierte zeit-
kontinuierliche Markoff-Kette modelliert. Das SAOM repr¨asentiert eine akteursba-
sierte Perspektive, indem es A¨nderungen von Verbindungen als Folge individueller
Akteursentscheidungen modelliert.
ZieldieserDissertationistes,MethodenzurUnterstu¨tzungderakteursbasiertenMo-
dellierung dynamischer Netzwerke bereitzustellen. Dabei werden zwei thematische
Schwerpunkte verfolgt:
1. Das SAOM ist eines der wenigen Netzwerkmodelle, die sich zur statistischen
Inferenz eignen. Allerdings ist die Interpretierbarkeit der abgeleiteten Ergeb-
nisse durch die Komplexit¨at des Modells erschwert. Derzeitige Analysen be-
schr¨anken sich auf Hypothesentests zur Bestimmung der statistischen Signifi-
i
kanz betrachteter Effekte. Die St¨arke einzelner Effekte bleibt dagegen weitest-
gehend unberu¨cksichtigt, da es fu¨r SAO Modelle bisher kein etabliertes Maß
zur Bewertung relativer Effektst¨arken gibt.
Ein solches Maß wird in dieser Arbeit eingefu¨hrt. Es basiert auf dem relativen
Einfluss der Effekte auf Akteursentscheidungen und beru¨cksichtigt sowohl die
Werte der Modellparameter als auch die untersuchten Daten und die gesamte
Modellspezifikation. Dadurch erlaubt es den Vergleich relativer Effektst¨arken
innerhalb eines Modells sowie fu¨r unterschiedliche Modelle und fu¨r verschiede-
ne Datens¨atze. Diese Vergleichbarkeit erleichtert die Interpretation und Kom-
munikation der inferentiell erhaltenen Ergebnisse.
2. Um die statistische Beherrschbarkeit des Modells zu gew¨ahrleisten, werden ei-
nigevereinfachendeAnnahmengetroffen,daruntereineHomogenit¨atsannahme
hinsichtlich des Verhaltens der Akteure, die impliziert, dass lokale Netzwerk-
mechanismen fu¨r alle Akteure in gleicher Weise gelten. In vielen F¨allen scheint
diese Verallgemeinerung ungerechtfertigt und m¨ogliche Ursache fu¨r verf¨alschte
Ergebnisse zu sein.
Im Folgenden werden diagnostische Methoden zur Validierung dieser Homoge-
nit¨atsannahme eingefu¨hrt. Misslingt die Validierung, unterstu¨tzen diagnosti-
sche Maßzahlen die Evaluierung existierender Inhomogenit¨aten und die Iden-
tifizierung einzelner Ausreißer oder Gruppen von Akteuren, deren Verhalten
von den vom Modell erwarteten Verhaltensweisen abweicht. Eine erste Me-
thode findet abweichende Akteure durch die Analyse der U¨bereinstimmungen
zwischen beobachteten und vom Modell erfassten Ver¨anderungen lokaler Netz-
werkkonfigurationen einzelner Akteure. Eine zweite Methode dient speziell
zur Identifizierung von Akteuren, deren abweichendes Verhalten die Param-
tersch¨atzung stark beeinflusst. Das Auffinden solcher einflussreicher Akteure
ist insbesondere wichtig, da ihr Einfluss zu verf¨alschten Ergebnisses fu¨hren
kann. Die eingefu¨hrten diagnostischen Maßzahlen approximieren die Sensiti-
vit¨atderSch¨atzergebnisseauflokaleSt¨orungenderzurSch¨atzungverwendeten
Netzwerkdaten.
Die Arbeit ist in vier Kapitel unterteilt: Kapitel 1 gibt einen U¨berblick u¨ber analy-
tische Konzepte und Modelle der statistischen Netzwerkanalyse. In Kapitel 2 wird
das zentrale Modell, das stochastic actor-oriented model (SAOM), eingefu¨hrt. Kapi-
tel 3 beinhaltet die Herleitung eines Maßes zur Bewertung relativer Effektst¨arken in
SAO Modellen, und Kapitel 4 besch¨aftigt sich mit der Entwicklung diagnostischer
Methoden zur Evaluierung von Homogenit¨atsannahmen hinsichtlich des Verhaltens
der Akteure im Netzwerk. Die Arbeit endet mit einer Diskussion der Ergebnisse und
m¨oglicher zuku¨nftiger Forschungsfragen.
ii
Acknowledgements
First and foremost, I would like to thank my advisor Ulrik Brandes for his guidance,
his constant support, and for everything I have learned from him. I have benefited
greatly from his wide knowledge and his inspiring enthusiasm for research, and I am
very grateful for the many opportunities he opened up to me. The attendance at
several scientific meetings all over the world, a research visit lasting several month,
and the flexibility to work partly from Stuttgart are only some examples.
I am extremely grateful to Tom Snijders for being my second referee and for inviting
me as a research visitor. The month in Oxford have been a great experience and
crucial for large parts of my research. Thank you very much for the many motivat-
ing and fruitful discussions and ideas.
I also want to thank Viviana Amati and Christian Steglich for helpful discussions
and important comments on my work as well as Sven Kosub and Marc Scholl for
joining my examination committee.
Many thanks go to all my colleagues from the algorithmics group and all the people
from E2 for their support, collaboration, and friendship, and for making my years
in Konstanz very special.
I am deeply grateful to my family, most of all my parents Katja and Markus In-
dlekofer and my brother Julian, for their stable and absolute support through all
these years.
Finally, I want to thank my wonderful partner Thomas Mundinger for all the love
and strength he gave me. Without his encouragement, his endless patience, and his
unfailing support, this dissertation would not have been possible. Thank you!
Natalie Indlekofer
February 2014
iii
Contents
Introduction 1
1 Statistical Analysis of Network Data 5
1.1 Basic Concepts and Terminology . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Typical Dependencies in Networks . . . . . . . . . . . . . . . . . . . . . . 10
1.3 Statistical Modeling of Social Networks . . . . . . . . . . . . . . . . . . . 13
1.3.1 Statistical Inference in Empirical Research. . . . . . . . . . . . . 13
1.3.2 Models for Cross-sectional Network Data. . . . . . . . . . . . . . 19
1.4 Statistical Models for Network Panel Data . . . . . . . . . . . . . . . . . 23
1.4.1 Continuous-time Markov Processes . . . . . . . . . . . . . . . . . 24
1.4.2 Dyad-Independence Models . . . . . . . . . . . . . . . . . . . . . . 28
2 Stochastic Actor-oriented Models 33
2.1 Formulation of the Model . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.1.1 Model Assumptions. . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.1.2 Actor Decisions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.1.3 Timing of Network Changes. . . . . . . . . . . . . . . . . . . . . . 38
2.1.4 Model Specification. . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.2 Parameter Estimation. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.2.1 Simulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
2.2.2 Method of Moments . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.3 Model Selection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.3.1 Significance Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
v
3 Relative Importance of Effects in SAOMs 55
3.1 Relative Importance in Regression Models . . . . . . . . . . . . . . . . . 57
3.2 How to Define Relative Importance in a SAOM? . . . . . . . . . . . . . 59
3.2.1 How to Assess Relative Importance in a Micro-step?. . . . . . . 60
3.2.2 Main Difficulties. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.3 A Measure of Relative Importance . . . . . . . . . . . . . . . . . . . . . . 63
3.3.1 Relative Impact on Actor Decisions . . . . . . . . . . . . . . . . . 63
3.3.2 Relative Impact on Network Evolution . . . . . . . . . . . . . . . 66
3.3.3 Computational Costs. . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.4 Application to a Network of University Freshmen. . . . . . . . . . . . . 69
3.4.1 Model Specification and Estimation Results . . . . . . . . . . . . 70
3.4.2 Relative Importance at Observation Moments. . . . . . . . . . . 72
3.4.3 Dynamics of Relative Importance . . . . . . . . . . . . . . . . . . 78
3.5 Discussion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4 Discovering Actor Inhomogeneity in SAOMs 89
4.1 Example Data: Friendships in a School Class . . . . . . . . . . . . . . . 91
4.2 Detecting Outliers and Deviating Groups. . . . . . . . . . . . . . . . . . 92
4.2.1 Local Fit of Individual Actors . . . . . . . . . . . . . . . . . . . . 92
4.2.2 Visual Exploration of Local Fit. . . . . . . . . . . . . . . . . . . . 100
4.3 Influence of Individuals on Estimates . . . . . . . . . . . . . . . . . . . . 102
4.3.1 Deletion of Single Cases to Assess their Influence. . . . . . . . . 103
4.3.2 What is a Single Case in a SAOM? . . . . . . . . . . . . . . . . . 105
4.4 Incorporate Perturbations into Estimating Functions. . . . . . . . . . . 106
4.4.1 Discrete Perturbations for Single Influential Actors. . . . . . . . 107
4.4.2 Continuous Perturbations for Groups of Influential Actors . . . 108
4.5 Sensitivity of Estimates towards Local Perturbations. . . . . . . . . . . 109
4.6 Directions of Maximum Sensitivity. . . . . . . . . . . . . . . . . . . . . . 111
4.6.1 Sensitivity of Single Parameters . . . . . . . . . . . . . . . . . . . 111
4.6.2 Aggregated Sensitivity of All Parameters. . . . . . . . . . . . . . 117
4.7 Discussion. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
vi
Conclusion 123
Bibliography 125
vii
Description:das zentrale Modell, das stochastic actor-oriented model (SAOM), eingeführt. Kapi- tel 3 beinhaltet die .. years of education. and Pearson, 2010; Knecht, Snijders, Baerveldt, Steglich, and Raub, 2010). indeed higher than expected under the assumption that tie variables in a triad are mutually