Pratique du calcul bayesien Springer Paris Berlin Heidelberg New York Hong Kong Londres Milan Tokyo Jean-Jacques Boreux " Eric Parent Jacques Bernier Pratique du calcul bayesien ~ Springer Jean-Jacques Boreux Universite deLiege(ULg) Departement desSciences et Gestiondel'environnement 185,avenue deLongwy 6700Arlon Belgique EricParent AgroParisTech 16,rueClaude-Bernard 75231 ParisCedex05 Jacques Bernier Le Pech-de-Biaud 24250Saint-Martial-de-Nabirat ISBN-13 :978-2-287-99666-5 SpringerParis BerlinHeidelberg NewYork © Springer-Verlag France,Paris,2010 Imprime en France Springer-VerlagFrance est membre du groupe SpringerScience +Business Media Cetouvrage estsoumis aucopyright. Tousdroitsreserves, notamment lareproduction etlarepresentation, latraduction,lareimpression, I'expose,lareproduction desillustrationsetdestableaux,latransmission par voie d'enregistrement sonore ou visuel, la reproduction par microfilm ou tout autre moyen ainsi que la conservationdesbanquesdedonnees.Laloifrancaisesurlecopyrightdu9septembre 1965danslaversion envigueurn'autoriseunereproductionintegraleoupartiellequedanscertainscas,etenprincipemoyennant lepaiement dedroits.Touterepresentation, reproduction, contrefacon ouconservation dans unebanque de donneesparquelqueprecedequecesoitestsanctionneeparIaloipenalesurIecopyright. L'utilisation dans cet ouvrage de designations, denominations commerciales, marques de fabrique, etc. meme sans specification ne signifie pas que ces termes soient libres de la legislation sur les marques de fabriqueetIaprotectiondesmarquesetqu'ilspuissentetreutilisesparchacun. a Lamaisond'editiondeclinetouteresponsabilitequant I'exactitudedesindicationsdedosageetdesmodes d'emploi,Danschaquecas,ilincombeaI'usagerdeverifierlesinformations donneesparcomparaison ala litteratureexistante. Maquettedecouverture:Jean-FrancoisMontmarche Collection Statistique et probabilites appliquees dlrigee parYadolah Dodge ProfesseurHonoraire UniversitedeNeuchatel Suisse [email protected] Comlte editorial : ChristianGenest StephanMorgenthaler DepartementdeMathematiques EcolePolytechniqueFederale etdestatistique deLausanne UniversiteLaval DepartementdesMathematiques QuebecGIK7P4 1015Lausanne Canada Suisse Marc Hallin GilbertSaporta UniversitelibredeBruxelles Conservatoirenational CampusdelaPlaineCP210 desartsetmetiers 1050Bruxelles 292,rueSaint-Martin Belgique 75141ParisCedex3 France LudovicLebart Telecom-Paris'Iech 46,rueBarrault 75634ParisCedex13 France Danslameme collection : - Statistique. La theorie et ses applications MichelLejeune,avril2004 - Optimisationappliquee Yadolah Dodge,octobre2004 - Le choixbayesien. Principes etpratique ChristianP.Robert,novembre2005 - Maitriser l'aleatoire.Exercices resolus deprobabiliteset statistique EvaCantoni,PhilippeHuber,ElvezioRonchetti,novembre2006 - Regression. Theorieetapplications Pierre-AndreCornillon,EricMatzner-Lober,janvier2007 - Leraisonnementbayesien.Modelisationetinference EricParent,JacquesBernier,juillet2007 - Premierspasensimulation YadolahDodge,GiuseppeMelfi,juin2008 - Genetiquestatistique StephanMorgenthaler,juillet2008 - Maitriserl'aleatoire. Exercicesresolusdeprobabiliteetstatistique, deuxiemeedition EvaCantoni,PhilippeHuber,ElvezioRonchetti,septembre2009 Preface Le troisicme millenaire sera, dit-on, celui de l'information. Aussi la statis- tique y sera-t-elle appelee a jouer un role important et le paradigme bayesien plus que tout autre, puisqu'il offre un cadre de raisonnement bien adapte a I'integration des opinions et des faits de toutes provenances qui interviennent dans la gestion des risques et la prise de decision en contexte d'incertitude. De la collecte de donnees a la prevision, l'analyse statistique pose plusieurs defis. L'elaboration du modele rcprcsentc sans doute la phase la plus delicate de l'exercice, car elle doit repondre a un double imperatif de realisme et de parcimonie. Hormis quelques cas de figure, une demarche bayesienne n'est en- visageable qu'a charge de disposer d'outils efficacespour la quantification et la mise a jour de l'information. Jouissant d'une expertise considerable dans le dornaine, les auteurs avaient deja brosse un tableau du Traitement bauesiende l'incertitude en sciences de l'environnement dans un ouvrageparuen 2000.Sixans plus tard, ChristianRo- bert publiait chez Springer Le choix bayesien - Principes et pratique, expose des fondements de la theorie qu'Eric Parent et Jacques Bernier completaient plaisamment en 2007 avec Le raisonnement btnjesien - Modelisatiori et infe- rence, paru dans la meme collection. Aujourd'hui, pour notre plus grand plaisir, Jean-Jacques Boreux, Eric Pa- rent et Jacques Bernier joignent a nouveau leurs forces pour nous instruire dans la Pratique du calcul bayesien. Al'aide d'exemples concrets, nombreux et varies, ilsnous initient ala construction de modeles bayesiens et au maniement a de l'imposant arsenal de calcul necessaire leur mise en oeuvre. Au passage, ils s'efforcent aussi d'aiguiser notre esprit critique! De l'halieutique a l'hydrometeorologie, en passant par la mesure des risques d'avalanche, de pneumoconiose ou de pollution en milieu clos, les auteurs de- cortiquent et analysent pour nous divers jeux de donnees issus de la pratique. Partant de series temporelles, de valeurs extremes ou d'effectifs de capture- recapture, ils nous montrent tantot comment decrire des relations entre plu- sieurs variables au moyen de graphes acycliques orientes, tant6t comment ba- tir ou affiner des modeles lineaires, generalises ou hierarchiques definis par conditionnements successifs. Al'occasion, ils font aussi appel au logiciel Win- BUGS pour illustrer le calcul de lois a posteriori au moyen de l'algorithme de Metropolis-Hastings ou de techniques particulaires dernier cri. Vlll Pratique du calcul bayesien Dans un souci didactique evident, les auteurs ont menage une gradation dans le degre de complexite des problemes etudies, Les premiers chapitres abordent des cas relativement simples, faciles aresoudre et bien adaptes a l'apprentissage des rudiments; les enseignants s'en inspireront avec bonheur. Les applications «grandeur nature» presentees en seconde partie font quant aelles un abondant usage de structures hierarchiques, de variables latentes et autres savantes constructions; le savoir-faire statistique et le genie du calcul numerique y apparaissent ici dans toute leur splendeur. Pour reprendre l'ai- mable locution des auteurs, le lecteur est ainsi progressivement amene «de la a plume la souris» et il en ressort ebloui et grandi. Gageons que specialistes et utilisateurs de la statistique s'approprieront rapidement cebeaulivre et qu'ils reconnaitront en lui un guide sur et accessible des principes modernes du calcul bayesian. Bonne lecture! Christian Genest, professeur Universite Laval, Quebec President sortant de la Societe statistique du Canada et de l'Association des statisticiennes et statisticiens du Quebec Avant-propos L'anticipation est une composante essentielle des capacites d'adaptation d'une societe et la statistique peut etre definie comme «l'art de raisonner de facon quantitative en avenir incertain ». Elle intervient dans toutes les disci- plines scientifiques OU se melent savoir et donnees. Elle est done utilisee par les physiciens, leseconomistes, les ingenieurs, les geographes, les biologistes, les assureurs, les psychologues, les metcorologues, les gestionnaires d'entreprises, etc., bref, par tous les praticiens soucieux de batir sur des fondations solides un pont entre theorie et donnees experimentales. Comme dans toutes les disciplines scientifiques, il faut d'emblee fixer le niveauqu'onseproposed'atteindre. II noussembleque quatre niveauxsuffisent apreciser les compctcnces. - Comme son qualificatif l'indique, le niveau elementaire est une prise de contact avec la discipline en question. S'agissant de la statistique, l'etu- diant saisit le sens general de la modelisation probabiliste, connait les distributions de base et est autonome dans des situations simples. - Le niveau suivant vise une qualification operationnelle, Ici I'etudiant est capablede construireunmodelequirepondaunquestionnement. IImanie les outils modernes de l'inference statistique, interprete et critique lcs resultats obtenus. - Le niveau suivant est la maitrise des concepts mathematiqucs qui justi- fient les procedures utilisees, Ace niveau, le statisticien fait preuve d'une tres grande creativite, comprend pourquoi une procedure faillit et sait y remedier. - Enfin, le quatrieme niveau est celui de la recherche fondamentale qui, par definition, introduit des nouvelles idees et./ou generalise des concepts existants sans avoir neccssaircmcnt de visec operationnelle au moment des travaux. Bien sur, il n'existe pas de separation nette entre ces niveaux mais, pour cet ouvrage, notre ambition est clairement une qualification operaiumnelle en statistique baueeiemic avec, peut-etre, quelques incursions au niveau maitrise. Avant de preciser cette ambition, il nous semble utile de remonter aux origines de ce livre. a Construire un modele statistique paromeirique des fins decisionncllcs, c'est oser avoir tort en maximisant ses chances d'avoir raison! Cette repartie
Description: