ebook img

Application en épidémiologie animale. PDF

158 Pages·2017·4.75 MB·French
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Application en épidémiologie animale.

Description et prédiction à partir de données structurées en plusieurs tableaux: Application en épidémiologie animale. Stéphanie Bougeard To cite this version: Stéphanie Bougeard. Description et prédiction à partir de données structurées en plusieurs tableaux: Application en épidémiologie animale.. domain_other. Université Rennes 2, 2007. Français. ￿NNT: ￿. ￿tel-00267595￿ HAL Id: tel-00267595 https://theses.hal.science/tel-00267595 Submitted on 27 Mar 2008 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés.     U ´ R 2, H B Numéro Année2007 Description et prédiction à partir de données structurées en plusieurs tableaux. Application en épidémiologie animale. Thèseprésentéepourobtenirlegradede      D ’U ´ R 2   D :S par  Stéphanie B Soutenuepubliquementle11décembre2007devantlejurycomposépar:  M.C Professeur,UniversitéRennes2 Directeurdethèse E.M.Q Professeur,ENITIAA,Nantes Co-directeurdethèse M.H Ingénieurderecherche,ENITIAA,Nantes Co-directeurdethèse  P.C Professeur,UniversitéDauphine,Paris Rapporteur G.S Professeur,CNAM,Paris Rapporteur B.F Ingénieurderecherche,CIRAD,Montpellier Examinateur  A.M Maîtredeconférences,UniversitéRennes2 Examinateur 2 Remerciements  J tiensàremerciertoutparticulièrementMostafaQannariquiaacceptédediriger cetravailderecherche.Laqualitédesonencadrement,sesconseilsetsadisponibi- litéenontpermislaréalisation.Mercidem’avoirfaitconfiance.Jetiensensuiteà remercierMohamedHanafipourtouteslesconnaissancesqu’ilm’atransmisesdans ledomainedesanalysesmultiblocs,ainsiquepoursagranderigueur.Sonreculsur lesujetabeaucoupapportéàcetravailderecherche.Mesremerciementsvontégale- mentàtoutel’équipederecherchedel’EcoleNationaled’IngénieursdesTechniques des Industries Agricoles et Alimentaires (ENITIAA, Nantes), notamment Evelyne Vigneau, Michel Semenou et Philippe Courcoux. C’est leur compétence, leur en- thousiasmeetleurqualitépédagogiquequim’ontdonnélegoûtdelarechercheen statistique. Je remercie Pierre Cazes et Gilbert Saporta pour l’intérêt qu’ils ont porté à ces recherches. Merci d’avoir accepté d’être rapporteurs de cette thèse et d’y ajouter de la valeur au travers de critiques constructives. Je remercie sincèrement Bernard Faye et Alain Mom d’avoir accepté de participer au jury de thèse. Je tiens enfin à remercier Michel Carbon de m’avoir ouvert les portes de son école doctorale et de m’avoiraccordésaconfiance. Ce travail de recherche s’est déroulé au sein de l’équipe d’Epidémiologie et Bien-EtrePorcindel’AgenceFrançaisedeSécuritéSanitairedesAliments(AFSSA, Ploufragan). Je tiens tout d’abord à remercier Gilles Salvat, directeur de cet éta- blissement, pour son accueil et l’intérêt qu’il a porté à ces travaux de recherche. Je souhaitetémoignermareconnaissanceàFrançoisMadec,responsabledecetteunité, pourm’avoirencouragéàfairecettethèse,soutenudanslaréalisationdecetravail et laissé entière liberté dans mes travaux de recherche. Toutes mes amitiés vont à l’équipe d’épidémiologie de l’AFSSA de Ploufragan, notamment Claire Chauvin, NicolasRoseetChristelleFablet,pourleursqualitéshumaines,leurdisponibilitéet toutcequ’ilm’ontappris.Ilsm’onttransmislaconnaissancedel’épidémiologie,de sonapplicationsurleterrainetdeslimitesdestraitementsstatistiquesusuelsappli- quéesàcesdonnées.Etjeremerciesincèrementl’équipetechniqued’épidémiologie, VirginieDorenlor,FlorentEono,EricEvenoetJean-PierreJolly,dontl’énergiesans limiteetl’enthousiasmeontpermis,entreautre,lerecueildesdonnéesutiliséespour cetravailderecherche. Merciàmafamille,àmesamis,etsurtoutàMichel,JulietteetCécile...pourtout lereste! 3 4 Table des matières Remerciements 3 Introduction 15 I Traitementstatistiquedesdonnéesd’épidémiologieanimale 19 1 Structuredesdonnéesd’épidémiologieanimale 21 1.1 Notionsd’épidémiologie . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.1.1 Définitiongénérale . . . . . . . . . . . . . . . . . . . . . . . . . 21 ff 1.1.2 Lesdi érentesciblesdel’épidémiologievétérinaire . . . . . . 22 1.1.3 L’épidémiologieanalytique . . . . . . . . . . . . . . . . . . . . 22 1.2 Quantificationdescausesdelamaladieparlesfacteursderisque . . 24 1.2.1 Définitiond’unfacteurderisque . . . . . . . . . . . . . . . . . 24 1.2.2 Quantificationparlerisquerelatifoul’oddsratio . . . . . . . . 25 1.2.3 Lienentrel’oddsratioetlescoefficientsderégression . . . . . 25 1.3 Structuredesdonnéesd’épidémiologieanimale . . . . . . . . . . . . 26 1.3.1 Organisationpratiquedesenquêtes . . . . . . . . . . . . . . . 26 1.3.2 Exempled’enquêtesd’épidémiologieanimale . . . . . . . . . 26 1.3.3 Caractéristiques générales des données d’épidémiologie ani- male . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 2 Problématiqueettraitementstatistiqueenépidémiologieanimale 31 2.1 Traitementstatistiqueenépidémiologieanimale . . . . . . . . . . . . 31 2.1.1 Utilisationclassiquedelarégression . . . . . . . . . . . . . . 31 2.1.2 Recoursàl’analysededonnées . . . . . . . . . . . . . . . . . 34 2.2 Problématiquestatistiqueenépidémiologieanimale . . . . . . . . . 38 2.2.1 Problèmesliésaugrandnombredevariablesexplicatives . . 38 2.2.2 Problèmesliésàlastructureengroupedesvariablesexplica- tives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.2.3 Problèmesliésàl’explicationdeplusieursvariables . . . . . 40 2.3 Contextedutravailderecherche . . . . . . . . . . . . . . . . . . . . . 41 5 6 TABLEDESMATIÈRES II Descriptiond’untableauXorientéeversl’explicationd’untableau Y 45 3 Analysededeuxtableaux 47 3.1 MéthodesliantdeuxtableauxXetY . . . . . . . . . . . . . . . . . . . 47 3.1.1 Analyseencomposantesprincipalessurvariablesinstrumen- tales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.1.2 Méthodesissuesdel’analyseencomposantesprincipales . . 50 3.1.3 Del’analysecanoniqueàlarégressionPLS . . . . . . . . . . . 52 3.2 VisionsynthétiquedesméthodesliantXetY . . . . . . . . . . . . . . 54 ff 3.2.1 Uniformitédescritèresassociésàdi érentescontraintes . . . 54 3.2.2 Dimensionoptimaledumodèlederégression . . . . . . . . . 55 4 Continuumdeméthodespermettantdedécrireetrelierdeuxtableaux 59 4.1 Uncontinuumpourcadregénéralauxméthodesliantdeuxtableaux 59 4.1.1 Propositiond’uncontinuumgénéral . . . . . . . . . . . . . . 59 4.1.2 Interprétationdesparamètresducontinuum . . . . . . . . . . 61 4.1.3 Comparaisonàd’autrescontinuums . . . . . . . . . . . . . . . 62 4.1.4 Sélection des continuums à explorer dans le cadre du traite- mentdesdonnéesd’épidémiologieanimale . . . . . . . . . . 65 4.2 Continuumsexplorésdanslecadrededeuxtableaux . . . . . . . . . 66 4.2.1 Continuumlatentrootregression . . . . . . . . . . . . . . . . . 66 4.2.2 ContinuumACPVI−PLSregression . . . . . . . . . . . . . . . 68 4.2.3 Sélectionsdesparamètresoptimauxdescontinuums . . . . . 73 5 Applicationautraitementdedonnéesorganiséesendeuxtableaux 75 5.1 Donnéesetproblématique . . . . . . . . . . . . . . . . . . . . . . . . . 75 5.2 Descriptiond’untableauXorientéeversl’explicationd’untableauY 76 5.2.1 Interprétationdescomposantes . . . . . . . . . . . . . . . . . . 76 5.2.2 Représentationfactorielle . . . . . . . . . . . . . . . . . . . . . 79 5.3 PrédictiondeYparX . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 ffi 5.3.1 Evolutiondelanormeduvecteurdecoe cients . . . . . . . 83 5.3.2 Nombreoptimaldedimensions . . . . . . . . . . . . . . . . . 83 5.3.3 PoidsdesvariablesXdansl’explicationdeY . . . . . . . . . . 86 III Description de K tableaux X orientée vers l’explication d’un ta- k bleauY 89 6 Analysede(K+1)tableaux 91 6.1 MéthodesliantKtableauxX àuntableauY . . . . . . . . . . . . . . 91 k 6.1.1 Formatdesdonnéesetobjectifs . . . . . . . . . . . . . . . . . . 91 6.1.2 Méthodess’apparentantàl’analysecanonique . . . . . . . . . 92 6.1.3 Extensionsdel’ACPVIaucasde(K+1)tableaux . . . . . . . 95 6.1.4 Méthodes issues de la régression PLS pour le cas de (K+1) tableaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 6.1.5 Extensiondelalatentrootregressionaucasde(K+1)tableaux 104 TABLEDESMATIÈRES 7 6.2 VisionsynthétiquedesméthodesliantKtableauxX àuntableauY 105 k ff 6.2.1 Uniformitédescritèresassociéesàdi érentescontraintes . . . 105 6.2.2 Apports des méthodes (K+1)−tableaux par rapport aux mé- thodes2-tableaux . . . . . . . . . . . . . . . . . . . . . . . . . 106 6.2.3 Choixdeladimensionoptimaledumodèlederégression . . 109 7 Continuumdeméthodespermettantdedécrireetrelier(K+1)tableaux 111 7.1 Uncontinuumpourcadregénéralauxméthodesliant(K+1)tableaux 111 7.1.1 Propositiond’uncontinuum . . . . . . . . . . . . . . . . . . . 111 7.1.2 Sélection des continuums à explorer dans le cadre du traite- mentdesdonnéesd’épidémiologieanimale. . . . . . . . . . . 112 7.2 Continuumsexplorésdanslecadrede(K+1)tableaux . . . . . . . . 113 7.2.1 ContinuumLRRmultibloc. . . . . . . . . . . . . . . . . . . . . 113 7.2.2 ContinuumACGsouscontrainte . . . . . . . . . . . . . . . . . 113 7.2.3 ContinuumACPVI−PLSmultibloc . . . . . . . . . . . . . . . 114 7.2.4 Sélectiondesparamètresoptimauxdescontinuums . . . . . . 116 8 Applicationautraitementdedonnéesorganiséesen(K+1)tableaux 117 8.1 Donnéesetproblématique . . . . . . . . . . . . . . . . . . . . . . . . . 117 8.2 Descriptiondetableauxstructurésenblocs . . . . . . . . . . . . . . . 118 8.2.1 Interprétationdescomposantes . . . . . . . . . . . . . . . . . . 118 8.2.2 Représentationfactorielle . . . . . . . . . . . . . . . . . . . . . 121 8.3 Prédictionàpartirdetableauxstructurésenblocs . . . . . . . . . . . 125 ffi 8.3.1 Evolutiondelanormeduvecteurdecoe cients . . . . . . . . 125 8.3.2 Nombreoptimaldedimensions . . . . . . . . . . . . . . . . . 126 8.3.3 Influencedesblocsetdesvariablesdansl’explicationdeY . 128 Conclusionetperspectives 135 Annexe:Listedespublications 139 Bibliographie 154 Index 154 8 TABLEDESMATIÈRES Table des figures 1 Exemplededonnéesstructuréesen(K+1)tableaux. . . . . . . . . . . 16 1.1 Cadre général simplifié de l’épidémiologie animale, d’après Toma etal.[1996]. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21 1.2 Principalesenquêtesenépidémiologievétérinaire. . . . . . . . . . . . 23 1.3 Enquêteexposé-nonexposé. . . . . . . . . . . . . . . . . . . . . . . . . 23 1.4 Enquêtecas-témoin.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 1.5 Illustrationdelastructureusuelledesdonnéesd’épidémiologieani- male. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 2.1 Illustration des corrélations entre les variables explicatives pour les données de l’enquête relative à l’EEL du lapin. Les traits entre les variables représentent les corrélations significatives à moins de 1%; . les traits plus épais pour celles à moins 01%. Les variables grisées sontcellesquisontlesplusliéesauxautres. . . . . . . . . . . . . . . . 39 2.2 Définition d’une variable Y de synthèse pour l’enquête sur l’EEL du lapin,d’aprèsKlein[2002]. . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.1 IllustrationdelastructuredestableauxXetY. . . . . . . . . . . . . . 47 3.2 Validation croisée basée sur l’utilisation de deux sous-échantillons : calibrationetvalidation. . . . . . . . . . . . . . . . . . . . . . . . . . . 57 4.1 Illustrationdescasparticuliersducontinuumgénéralisantlesprinci- palesméthodesliantuntableauXàuntableauY. . . . . . . . . . . . 61 4.2 Illustration du domaine exploré par la méthode principal covariate regression. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.3 Illustrationdesdomaines(possibles)explorésparlesméthodesconti- nuumpowerPLSetjointcontinuumregression. . . . . . . . . . . . . . . 64 4.4 Illustrationdudomaineexploréparl’analysecanoniqueridge. . . . . 65 4.5 IllustrationdudomaineexploréparlecontinuumLRR. . . . . . . . . 67 4.6 IllustrationdudomaineexploréparlecontinuumACPVI−PLS. . . . 69 5.1 Pourcentage cumulé des inerties expliquées par les composantes (t(1),...,t(h)).ComparaisondesméthodesACPVI,régressionPLS,ver- sionmodifiéedelalatentrootregressionetrégressionsurcomposantes d’ACP(PCR). . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 9

Description:
Les composantes t et u recherchées sont à la fois corrélées entre elles, mais aussi représentatives de leur groupe de variables, du fait de la prise en compte de l'inertie de chacun des deux tableaux. L'analyse factorielle inter-batterie peut donc être vue comme un compromis entre l'analyse c
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.