ebook img

Identification de modèles appropriés pour l'inférence causale à partir de données d'observation PDF

237 Pages·2016·19.04 MB·French
by  TalbotDenis
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Identification de modèles appropriés pour l'inférence causale à partir de données d'observation

UNIVERSITÉ DU QUÉBEC À MONTRÉAL IDENTIFICATION DE MODÈLES APPROPRIÉS POUR L'INFÉRENCE CAUSALE À PARTIR DE DONNÉES D'OBSERVATION THÈSE PRÉSENTÉE COMME EXIGENCE PARTIELLE DU DOCTORAT EN MATHÉMATIQUES PAR DENIS TALBOT JUILLET 2015 UNIVERSITÉ DU QUÉBEC À MONTRÉAL Service des bibliothèques Avertissement La diffusion de cette thèse se fait dans le respect des droits de son auteur, qui a signé le formulaire Autorisation de reproduire et de diffuser un travail de recherche de cycles supérieurs (SDU-522- Rév.0?-201 î ). Cette autorisation stipule que «conformément à l'article î î du Règlement no 8 des études de cycles supérieurs, [l'auteur] concède à l'Université du Québec à Montréal une licence non exclusive d'utilisation et de publication de la totalité ou d'une partie importante de [son] travail de recherche pour des fins pédagogiques et non commerciales. Plus précisément, [l'auteur] autorise l'Université du Québec à Montréal à reproduire, diffuser, prêter, distribuer ou vendre des copies de [son] travail de recherche à des fins non commerciales sur quelque support que ce soit, y compris l'Internet. Cette licence et cette autorisation n'entraînent pas une renonciation de [la] part [de l'auteur] à [ses] droits moraux ni à [ses] droits de propriété intellectuelle. Sauf entente contraire, [l'auteur] conserve la liberté de diffuser et de commercialiser ou non ce travail dont [il] possède un exemplaire.>> AVANT-PROPOS Le 8 septembre 2010 commençait pour moi une longue, parfois difficile, mais très enrichissante, aventure. Je contactais alors Geneviève par courriel pour lui demander si elle était disponible et intéressée à superviser les études doctorales que j'allais débuter officiellement en septembre 2011, mais pour lesquelles je commençais déjà à me préparer en effectuant des demandes de bourse. Ce n'était que le début. Durant les quatre années qui ont suivi, j'ai effectué de nombreuses lectures sur l'inférence causale, j'ai étudié comme un fou pour réussir les examens de synthèse en mathématiques, j'ai suivi plusieurs cours, j'ai rédigé trois articles scientifiques et collaboré à l'écriture de deux autres, j'ai participé à des congrès où j'ai effectué des présentations, ... J'approche maintenant la fin du périple doctoral: je finalise l'écriture de la thèse. J'ai beaucoup travaillé et je suis fier du travail que j'ai accompli, mais je ne pourrais passer sous silence toute l'aide que j'ai reçue pour mener à bien ce projet. J'adresse mes premiers remerciements à Geneviève qui a accepté de me superviser et qui m'a fait découvrir ce domaine passionnant de la statistique qu'est l'inférence causale. Geneviève a énormément contribué à rna réussite, de par ses conseils, sa disponibilité et ses révisions détaillées. Je tiens également à remercier Juli, rna co-superviseure. Les conseils et les révisions de Juli ont grandement contribué à améliorer la qualité de la thèse et des articles qui y sont présentés. En particulier, Juli a un grand souci du détail et dispose d'une capacité impressionnante à repérer les éléments qui pourraient manquer de clarté pour les lecteurs. Je veux aussi remercier les amis que j'ai côtoyés et qui m'ont offert un support moral pendant le doctorat : Sandra, Alexandre, Simon 0., Simon J., Claudia, Anne-Sophie et Tanya. Un merci tout spécial à Sandra, Alexandre et Anne-Sophie lV qui m'ont occasionnellement hébergé à Montréal (dans le cas de Sandra, plus qu'occasionnellement!). Je remercie également mes parents pour leur support et pour l'éducation qu'ils m'ont donnée. Ils m'ont appris à persévérer pour atteindre mes objectifs. Un merci tout spécial à Jimmy, qui partage ma vie depuis près de trois ans, pour son support, ses encouragements et sa capacité à relativiser les problèmes rencontrés. Finalement, je veux remercier le Conseil de recherches en sciences naturelles et en génie du Canada ainsi que le Fonds de recherche du Québec- Nature et technologie pour leur support financier. Sans ce support, il aurait été beaucoup plus difficile, voire impossible, de me concentrer comme je l'ai fait à mes études et de compléter le doctorat aussi rapidement. A Blake, mon filleul. Tu es un petit garçon adorable, j'aimerais tellement pouvoir te voir plus souvent. «Entre Ce que je pense Ce que je veux dire Ce que je crois dire Ce que je dis Ce que vous avez envie d'entendre Ce que vous croyez entendre Ce que vous entendez Ce que vous avez envie de comprendre Ce que vous croyez comprendre Ce que vous comprenez Il y a dix possibilités qu'on ait des diffiwltés à communiquer. Mais essayons quand même. .. » Bernard Werber, L'Encyclopédie du savoir relatif et absolu -------------------------- TABLE DES MATIÈRES LISTE DES TABLEAUX. xiii LISTE DES FIGURES xvii RÉSUMÉ . . . . . . xix INTRODUCTION . 1 CHAPITRE I LES PARADIGMES CONTREFACTUEL ET GRAPHIQUE À L'INFÉRENCE CAUSALE . . . . . . . . . . 5 1.1 Le paradigme contrefactuel 5 1.1.1 Notation ...... . 5 1.1.2 Définition de l'effet causal . 6 1.1.3 Confusion . . . . . 8 1.2 Le paradigme graphique 10 1.2.1 Construction d'un graphe 10 1.2.2 Vocabulaire . . . . . . . . 12 1.2.3 DAGs et associations statistiques . 13 1.2.4 Identifier et éviter la confusion à l'aide d'un DAG 14 1.3 La sélection de modèles pour l'inférence causale ... .. 15 1 Sélection de modèles guidée par les données pour l'inférence causale 17 CHAPITRE II UNE REVUE DE QUELQUES MÉTHODES EXISTANTES . 19 2.1 Le modèle moyen bayésien ... ... . 20 2.2 La méthode de Crainiceanu et al. (2008) 22 2.3 Les algorithmes BAC et TBAC 24 2.3.1 TBAC ......... . . 26 Vlll 2.3.2 BAC ................... . 27 2.4 L'approche de VanderWeele & Shpitser (2011) 28 2.5 Les méthodes de Persson et al. (2013) 30 2.6 Autres méthodes 32 CHAPITRE III DÉVELOPPEMENTS CONCERNANT L'ALGORITHME BAC 35 3.1 Loi a posteriori marginale de f3 . . . . . . . . . . . . . . . . 35 3.2 Justification de BAC par le paradigme graphique causal . 38 3.3 Choix de w . . . . . . 39 3.4 Le package BACprior 39 3.4.1 La fonction BACprior .lm . 40 3.4.2 Les fonctions BACprior. CV et BACprior. boot 41 3.5 Discussion sur l'algorithme BAC ... 41 CHAPITRE IV PREMIER ARTICLE : THE BAYESIAN CAUSAL EFFECT ESTIMATION ALGORITHM 43 4.1 Introduction . 44 4.2 Bayesian causal effect estimation (BCEE) . 46 4.2.1 Modeling framework ..... . . 46 4.2.2 A motivation based on directed acyclic graphs 48 4.2.3 The BCEE algorithrn . . . . 49 4.2.4 The rationale behind BCEE 53 4.2.5 A toy example . . . . . . . 55 4.3 Practical considerations regarding BCEE 58 4.3.1 Choice of w . . . . . 58 4.3.2 Implementing BCEE 60 4.4 Simulation studies . . . 62 4.4.1 Main simulations 63 4.4.2 Additional simulations . 75 ---- - ---------- - -------- - ----- -------- ix 4.5 Application : Estimation of the causal effect of perceived mathematical competence on grades in mathematics 77 4.6 Discussion 80 4.7 Appendix 82 4.7.1 Back-door adjustment and linear regression adjustment . 82 4.7.2 Proofs . . 84 4.7.2.1 Proof of Proposition 4.2.1 84 4.7.2.2 Proof of Corollary 4.2.1 . 85 4.7.3 General conditions for the equivalence of zero regression coefficient and conditional independence 87 4.7.4 The behavior of QaY 89 4.7.5 Marginal posterior probabilities of inclusion of potential confounding covariates . . . . . . . 91 4.7.6 Simulation results for scenarios with (3 = 0 96 4.7.7 Simulation results for scenarios with exponential errors 100 4.7.8 Comparison of the distribution of~ obtained from A-BCEE and BAC 103 II Identification de modèles pour l'inférence causale guidée par la littérature scientifique 105 CHAPITRE V INTRODUCTION AU HONOLULU HEART PROGRAM ET AUX MODÈLES STRUCTURAUX MARGINAUX . . . . . . . . . . . . . . . . . 107 5.1 Objectifs de l'analyse des données du Honolulu Heart Program 108 5.2 Les données du Honolulu Heart Program 109 5.2.1 Mesure de l'activité physique .. 109 5.2.2 Mesure de la pression artérielle . 110 5.2.3 Mortalité et événements cardiaques 110 5.3 Modèles structuraux marginaux 111 5.3.1 MSMs à mesures répétées 112 5.3.2 MSMs classiques 114 5.3.3 MSMs de Cox . . 116 x 5.4 Résumé des analyses statistiques effectuées . . . . . . . . . . . . . . . . . . . 118 CHAPITRE VI DEUXIÈME ARTICLE : A GRAPHICAL PERSPECTIVE OF MARGINAL STRUCTURAL MODELS WHEN ESTIMATING THE CAUSAL RELATIONSHIPS BETWEEN PHYSICAL ACTIVITY, BLOOD PRESSURE, AND MORTALITY 121 6.1 Introduction 122 6.2 Data 123 6.2.1 Data treatment 124 6.3 Building causal graphs 125 6.3.1 Building the initial DAGs 126 6.3.2 Assessing the fit of and improving the initial DAGs 127 6.3.3 Identifying confounding variables . . . . . 129 6.4 Marginal structural models for repeated measures 131 6.4.1 Estimation with incomplete data . . . . . . 133 6.4.2 Conditional marginal structural models for repeated measures 134 6.5 Marginal structural Cox models . . . . . . . . . . 135 6.6 Contrasting our approach with a naive approach 137 6.7 Comparing conditional and unconditional MSM_"R..Ms 138 6.7.1 Simulation scenarios 139 6.7.2 Simulation results 141 6.7.3 HHP results 142 6.8 Discussion 143 6.9 Appendix 145 6.9.1 Variables used in IPTWs 145 6.9.2 Calcula ting the marginal causal effects in Scenario 4 147 CHAPITRE VII TROISIÈME ARTICLE : A CAUTIONARY NOTE CONCERNING THE USE OF STABILIZED WEIGHTS IN MARGINAL STRUCTURAL MODELS 149 7.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150

Description:
Un merci tout spécial à Jimmy, qui partage ma vie depuis près de trois ans, pour son .. an unobserved common cause between the variables.
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.