Thèse de Doctorat d’Aix-Marseille Université Spécialité Ecologie Marine Soutenue par Romain DAVID le Vendredi 6 Juillet 2018 De la conception d'un système d'observation à large échelle au déploiement et à l'exploitation de son système d'information Application à l'observation des habitats coralligènes et à la colonisation de récifs artificiels (ARMS) D. Ienco, IRSTEA, Montpellier (rapporteur) T. Saucède, Biogéosciences, univ. Bourgogne, Dijon (rapporteur) L. Berti-Equille, AMU, Marseille (examinateur) T. Tatoni, AMU, I.M.B.E., Marseille (examinateur), R. Vigne-Lebbe, M.N.H.N.-U.P.M.C., Paris (examinateur) J.-P. Féral, C.N.R.S., I.M.B.E., Marseille (directeur) Remerciements Je tiens tout d’abord à remercier mon directeur de thèse Jean-Pierre Féral, de m’avoir proposé ce sujet et m’avoir épaulé, y compris financièrement (sur ses contrats ou en obtenant des crédits dédiés de la part de l’INEE), pendant ces années riches en expériences et en formations. Il m’a aussi fait confiance en me proposant la direction d’un “work package” dans le cadre du programme européen CIGESMED dont il était responsable. J’ai pu, grâce à ce soutien et cet engagement, faire mes premiers pas dans le monde de la recherche, et petit à petit comprendre l’organisation, les méthodes de travail, les tenants et les aboutissants de la carrière d’un chercheur en écologie marine. Je voudrais aussi remercier tous les membres de mon comité de thèse qui m’ont conseillé et proposé de nouvelles orientations afin d’enrichir mon travail au cours de ces dernières années, ces conseils et idées m’ont été précieux. Merci également à tous les membres du jury d’avoir accepté de donner de leur temps et de leur énergie pour évaluer ce travail. Ma gratitude se porte aussi tout particulièrement vers mes collègues et/ou étudiants de la Station (anciens et actuels) avec lesquels j’ai eu le plus d’interactions, en particulier Anne Chenuil, responsable du programme DEVOTES, avec qui j’ai eu le plaisir de mettre en place l’expérience reposant sur les ARMS, Pascal Mirleau chercheur et plongeur, Abigail Cahill (post-doctorante), Emilie Egea (Ingénieur de recherche), Giulia Gatti (post-doctorante et plongeuse), Aurélien De Jode (Doctorant), Alexandra Weber (doctorante), Marjorie Selva (technicienne) et Sandrine Chenesseau (Technicienne et plongeuse). Un grand merci à mes collègues de l’axe thématique “gestion de la biodiversité et des habitats naturels” avec lesquels j’ai collaboré sur de nombreux aspects de la DCSMM ou de la gestion d’espaces naturels à savoir Xavier Fizzala, Florent Renaud, Sandrine Serre, Pauline Vouriot chargés de mission DCSMM pour le descripteur 4 et Laure Thierry de Ville d'Avray (doctorante). Un coup de chapeau spécial aux étudiants qui ont réalisé leurs stages dans le cadre des programmes CIGESMED et DEVOTES et qui se sont investis sans compter pour assurer la récolte et l’analyse de données et d’échantillons de terrain (analyse photo notamment) et/ou les différents traitements de matériel prélevé. Parmi eux, j’ai eu le plaisir d’encadrer dans le cadre de leur stage Dorian Guillemain, Laure Thierry De Ville D’Avray, Walid El Guerrabi, Jacky Dubar, Ohane Legendarme. J’ai aussi eu le plaisir de travailler avec d’autres étudiants comme Zinovia Erga, Sophie Dubois (et pardon pour ceux que j’oublie). Nous avons tous ensemble formé une équipe de choc : sans vous, ce travail ne serait pas ce qu’il est. 2 J’ai rencontré des personnes remarquables, professionnelles et humaines à la fois à l’OSU Pythéas, à la station marine d’Endoume et à l’IMBE. Ceux-ci, dans des contextes bien différents, ont été à mon égard d’une bienveillance souvent rassurante. Pour cette attention, je remercie tout particulièrement Cyrille Blanpain, Carole Borchellini, Alrick Dias, Dominique Estival, Giulia Gatti, Christian Marschal, Emmanuelle Renard, Léïta Tschanz, Marc Verlaque, Lilita Vong. Un remerciement tout particulier à Joëlle Massei, notre gestionnaire pour m’avoir aidé avec bienveillance et patience dans la gestion administrative des programmes et actions que j’ai pu mettre en œuvre ces dernières années. J’ai aussi des remerciements spéciaux à faire, notamment à Bernard De Ligonnès, pilote du pointu l’Armandia et d’une aide et d’une disponibilité à toute épreuve. Bonne retraite à toi, je garderai un souvenir impérissable de tous ces moments passés sur l’eau ou ailleurs avec toi : sans aucun doute parmi mes meilleurs souvenirs de ces années. Cette thèse a aussi pu avancer grâce à des financements institutionnels. La construction du premier prototype pour le consortium IndexMed a été financée par l’INEE qui a soutenu le projet "CHARLIEE" (CHAnger de Regard En Liant dans IndexMed l’Environnement et les Étoiles - PEPS Blanc) en 2014, puis par le CNRS via le défi "VIGI-GEEK (VIsualisation of Graph In transdisciplinary Global. Ecology, Economy and Sociology data-Kernel)" en 2015, enfin par un financement alloué directement par la direction pour l’interdisciplinarité du C.N.R.S. en 2016. En 2017 et 2018, c’est l’action GRAMINÉES qui a été labellisée et soutenue par le GDR MaDICS. Ce soutien a permis d’obtenir un cofinancement de la F.R.B. Les données utilisées dans le cadre de cette thèse ont été obtenues dans le cadre du projet européen CIGESMED <www.cigesmed.eu> (conventions ANR n° 12-SEAS-0001-01, 02 et 03 pour la France, GSRT-12SEAS-12-C2 pour la Grèce, projet TUBITAK No : 112Y393 pour la Turquie). En complément, en 2016, 2017 et 2018, le Labex DRIIHM a soutenu un programme propre aux OHM, et cofinancé les séminaires et ateliers IndexMEED. Merci aussi pour leur soutien aux séminaires au labex OT-Med, à l’OHM Littoral Méditerranéen, à l’OSU Pytheas, à la Fédération de Recherche Eccorev et à la Fondation pour la Recherche sur la Biodiversité. Je souhaite adresser mes plus vifs remerciements aux partenaires des différents programmes de recherche CIGESMED* et DEVOTES**, avec lesquels j’ai pu interagir. Ces programmes ont été un cadre riche et motivant pour effectuer ce travail. Mes remerciements aux contributeurs les plus actifs lors des séminaires organisés dans le cadre de CIGESMED, français, grecs et turcs qui, lors de nos débats et lors de séminaires intensifs ont contribué à améliorer le protocole et faire avancer les travaux de ce programme. 3 Le soutien de France Grilles et notamment de Vincent Breton, Geneviève Romier et Yannick Legré a permis d'expérimenter et d’utiliser les ressources informatiques sur l'Infrastructure Grid Nationale et ont financé une partie des formations et séminaires sur les outils de calculs parallélisés auxquels j’ai pu assister. Dans ce cadre, je souhaite dire ma reconnaissance à Gergely Sipos, Jan Bot et Roberta Piscitelli pour le soutien utile fourni lors de l'atelier “design your e-infrastructure” EGI <www.egi.eu>. Je souhaite par ailleurs remercier l’équipe de la F.R.B. et particulièrement Aurélie Delavaud, Anna Cohen Nabeiro, Robin Goffaux et leur direction pour avoir permis par leurs appuis financier, technique, administratif et scientifique la réalisation des ateliers et séminaires de IndexMEED ces deux dernières années et ainsi avoir tant favorisé son développement. Merci aussi à tous les organisateurs, membres du conseil scientifique d’IndexMEED, intervenants et participants aux différents séminaires, et aux ateliers cartographie de compétences, curation puis visualisation de données (IndexMed puis IndexMEED) : sans votre investissement et votre confiance, nous n’aurions pas réussi à atteindre les ambitieux objectifs que nous nous étions fixés (notamment Anne-Sophie Archambeau, Fanny Arnaud, David Auber, Nicolas Bailly, Loup Bernard, Cyrille Blanpain, Vincent Breton, Denis Couvet, Alrick Dias, Sophie Gachet, Robin Goffaux, Karina Gibert, Manuel Herrera, Dino Ienco, Romain Julliard, Julien Lecubin, Yannick Legre, Michelle Leydet, Grégoire Loïs, Victor Méndez Muñoz, Jean-Charles Meunier, Isabelle Mougenot, Sophie Pamerlon, Jean-Claude Raynal, Geneviève Romier, Dad Roux-Michollet, Alison Specht, Christian Surace, Thierry Tatoni, et tant d’autres). Merci aussi à l’équipe technique du S.I.P. (Service Informatique de l’O.S.U. Pytheas) notamment Cyrille Blanpain, Julien Lecubin et Alrick Dias sans qui le développement du prototype n’aurait pas pu aboutir et sur qui j’ai aussi pu compter pour m’aider à organiser puis animer les différents ateliers interdisciplinaires. Et enfin, ce qui compte le plus pour moi, ma famille : merci à mes grands-parents, cousins et cousines d’avoir constitué l’univers dans lequel j’ai pu me construire et puiser les exemples dont j’ai eu besoin lors de ce travail. Merci à ma famille, particulièrement mes parents, et ma fratrie (Sophie, Emilie, Julie, Benjamin, Marie et Quentin) ; J’ai bien conscience pendant ces six années de vous avoir délaissés ; vous êtes mon véritable chez moi, et j’en avais déjà largement conscience, s’il ne devait me rester plus qu’un seul dernier soutien, ce serait bien de vous qu’il proviendrait. Plus particulièrement, Merci à David, mon beau-frère, Marie et Emilie, mes soeur, Sophie ma cousine et Dr Sophie Gachet pour leurs relectures attentives et leurs conseils avisés. Merci à mon frère Benjamin pour son soutien moral et financier, et pour la droiture, le courage et la volonté que tes aventures t’ont demandés, ils ont été pour moi un exemple. Pour conclure, merci à Doriane, compagne de vie de ces 12 dernières 4 années, pour tes encouragements, ta détermination et ta volonté dans ta nouvelle profession qui ont été pour moi un moteur pour terminer ce travail. 5 Sommaire Remerciements 2 Sommaire 6 Résumé 12 Summary 16 Avant-propos 19 Chapitre 1 : Introduction : éléments de contexte et enjeux concernant l’observation en milieu marin côtier et les systèmes d’information à large échelle 23 1. Concepts généraux et enjeux concernant l’observation en milieu marin côtier 23 1.1 L’utilisation des navires, bouées appareillées et satellites pour l’observation 23 1.2 L’observation in situ des fonds sous-marins 24 Les variables concernant le benthos 24 Les méthodes d’étude destructrices 25 Les méthodes non destructrices reposant sur la plongée 28 1.3 La gestion de la donnée scientifique d’observation sous marine : état des lieux d’un domaine peu développé 33 2. Enjeux de l’observation du benthos de substrat dur en milieu côtier sur de grandes échelles géographiques 39 2.1 Généralités sur l’observation à large échelle 39 2.2 Les limites actuelles de l’observation automatisée des habitats benthiques durs en milieu côtier 41 2.3 La nécessaire utilisation de données d’interprétation 42 2.4 L’échantillonnage pour l’observation basée sur des études « moléculaire », de nouvelles méthodes de suivi ? 43 2.5 Analyses et approches comparatives / intégratives 44 2.6 L’unité taxonomique, chaînon nécessaire pour la compréhension systémique du niveau d’intégration du moléculaire au paysage 44 3. Concepts généraux et questionnements concernant les systèmes d’information à large échelle sur la biodiversité 45 3.1 Contexte : des données [de plus en plus] hétérogènes et multi sources 45 3.2 Le Big Data pour la biodiversité ? 48 3.3 La quête de l’interopérabilité 49 Contexte : des besoins d’agrégation dans un système très hétérogène 49 Définitions et concepts autour de l'interopérabilité 51 Evolution des cadrages et recommandations sur les plans français, européen et international 54 Etat des lieux de l’interopération dans le domaine de la biodiversité 54 3.4 Entrepôts de données et accès aux données 55 4. CIGESMED, premier programme cadre de cette étude 60 4.1 Objectif de la thèse dans le cadre de CIGESMED 60 “Le coralligène”, un patchwork d’habitats riches et variés 62 Interactions biotiques au sein des habitats coralligènes 64 4.2 Pourquoi les habitats coralligènes comme cas d’étude ? 64 Observation des habitats coralligènes, quels challenges à large échelle ? 66 5. DEVOTES, Deuxième programme cadre de cette étude 68 6. Questionnements, hypothèses et objectifs concernant l’observation à large échelle du benthos de substrat dur en milieu côtier et les systèmes d’information associés 70 6 Chapitre 2 : Les travaux concernant les protocoles d'observation dans le cadre des programmes CIGESMED et DEVOTES 73 1. Questionnements et hypothèses concernant l’efficacité des outils, méthodes et protocoles 73 1.1 Questionnements et hypothèses concernant la mise en oeuvre du protocole “Intercalibration” 73 1.2. Questionnements et hypothèses concernant le protocole “Cartographie des profils et peuplements” (Module 1 du protocole CIGESMED) 75 1.3. Questionnements et hypothèses concernant la mise en oeuvre du protocole “Analyse d’images” dans le cadre de CIGESMED 76 1.4. Questionnements et hypothèses concernant la mise en oeuvre du protocole “Analyse d’images” dans le cadre de DEVOTES 79 2. Méthodes d’intercalibration, de cartographie et d’analyses d’images 80 2.1 Méthodes d’inter-calibration 83 Méthode de choix des variables mesurables et les modalités qu’elles peuvent prendre 84 Méthode d’étude de la variabilité due à l’échantillonnage 84 Méthode d’étude de la variabilité due à l’observateur 88 Méthode d’étude de la variabilité due à l’opérateur 89 Focus sur PhotoQuad 90 Méthode d’étude de la variabilité due au système d’observation 93 2.2 Méthode de cartographie 93 2.3 Méthode d’analyse d’image dans le cadre de CIGESMED 99 Liste des taxons utilisés 100 Traitement des photos 100 Contextualisation des quadrats photo lors de la mise en œuvre des relevés photographiques 101 Nomenclature et archivage des photos 101 2.4 Méthode d’analyse d’image dans le cadre de DEVOTES 102 Sites échantillonnés 102 Installation et récupération des ARMS 105 Analyses de photos 106 Facteurs environnementaux 107 Analyses statistiques 107 3. Résultats concernant l’efficacité et la mise en pratique des outils, méthodes et protocoles 109 3.1 Résultats concernant l’inter-calibration 109 Résultats concernant les choix de variables et les modalités qu’elles peuvent prendre 109 Résultats concernant l’étude de la variabilité due à l’observateur 122 Résultats concernant l’étude de la variabilité due à l’échantillonnage 124 Résultats concernant l’étude de la variabilité opérateur 124 Résultats concernant la variabilité technique du système d’observation 126 3.2 Résultats concernant la contextualisation reposant sur la cartographie du coralligène 127 3.3 Résultats concernant l’analyse d’image dans le cadre de CIGESMED 128 3.4 Résultats concernant l’analyse d’image dans le cadre de DEVOTES 130 4. Discussions et perspectives concernant l’efficacité des outils, méthodes et protocoles 138 4.1 Discussion concernant l’intercalibration 138 L’intercalibration des observateurs en plongée 138 Dynamiques et efficacité de l’inter-calibration 139 L’inter-calibration formatrice 140 Inter-calibration, un défi dépendant de nombreux facteurs humains 140 4.2 Discussion concernant le protocole de cartographie 141 7 Qu’apporte la contextualisation basée sur la cartographie ? 141 4.3 Discussion concernant l’analyse des photos CIGESMED 142 4.4 Discussion concernant l’analyse des photos des faces de plaques des ARMS 144 4.5 Inter-calibration, une nécessité face aux directives internationales 149 Chapitre 3 : Utilisabilité des données et systèmes de gestion et d’entreposage des données 151 1. Généralités et questionnements concernant les systèmes de gestion et d’entreposage des données 151 1.1 Quelques observations sur les relations entre typologie et propriétés des données 151 Cadre légal du partage de la donnée en France et en Europe 152 Convention d’Aahrus 152 Directive INSPIRE 153 Identification des freins à la mutualisation de la donnée 153 1.2 La mise à disposition de la donnée avec les principes FAIR 157 Réalité de la mise en œuvre des principes FAIR et des textes associés 158 1.3 Cycle de vie de la donnée, à quelles conditions? 158 2. Structure de données dans le cadre de CIGESMED et de DEVOTES 161 3. Regard critique concernant les systèmes de gestion et d’entreposage des données dans le cas d’une application aux données issues des programmes CIGESMED et DEVOTES 168 La métadonnée : un outil nécessaire mais pas suffisant 168 Objectifs de la métadonnée à large échelle, en général, puis pour les programmes CIGESMED et DEVOTES 170 Méthode de cartographie des métadonnées dans le cadre de CIGESMED 171 Contenu des métadonnées dans le cadre de CIGESMED 172 4. Discussions et perspectives d’amélioration concernant les systèmes de gestion et d’entreposage des données appliqués aux données d’écologie marine. 173 Cycle de vie des données et des métadonnées dans le cadre de CIGESMED et de DEVOTES 173 Chapitre 4 : Une architecture pour la ré-exploitation et la fouille des données hétérogènes en écologie 175 1. Généralités, questionnements et hypothèses concernant la ré-exploitation et la fouille des données 175 1.1 Objectifs à court et long terme concernant la donnée 175 1.2 Enjeux de la préservation de la donnée : 176 1.3 Qualifications de la donnée 178 La qualification, outil pour l’interopérabilité 178 La qualification comme outil d’enrichissement de la donnée 178 La qualification de données est souvent catégorielle 179 1.4 La fouille de données basée sur les graphes 179 Quelques notions sur les représentations basées sur les graphes 179 Le clustering : Analyser les regroupements de nœuds pour aller un peu plus loin 180 Utilisation en écologie/environnement : 181 L’analyse des contextes liés aux clusters de graphes 181 2. Méthodes de conception des processus de test 183 2.1. Conception de l’architecture et des services 183 2.2. Développement d’un prototype 186 2.3. Méthode d’animation d’ateliers concernant la curation et la visualisation sous forme de graphes 188 3. Résultats de la phase de conception des processus et de la phase d’expérimentation du prototype 189 3.1. Schéma décrivant l’architecture du système d’information 189 3.2. Le prototype et ses spécificités fonctionnelles 191 Présentation du prototype 191 8 Spécifications fonctionnelles du prototype : 192 3.3. Les graphes générés par le prototype d’IndexMed 196 3.4. Atelier sur la qualification et la curation des données : intérêts, méthodes, difficultés. 206 3.5. Ateliers visualisation et résultats préliminaires concernant la visualisation des clusters de photos de plaques d’ARMS : 208 Premiers résultats de visualisation des clusters de photos de plaques d’ARMS 208 Prochaines étapes concernant le clustering et la visualisation des plaques ARMS 210 3.6. “How to do” 210 4. Discussion et perspectives concernant les méthodes de fouille de données environnementales basées sur les graphes 211 4.1 Intérêts des représentations visuelles 211 4.2 Éléments de discussion concernant les utilisations possibles des graphes générés par le prototype d’IndexMed et lors des ateliers 212 4.3 Les graphes utilisés par des environnementalistes : la nécessité absolue de travailler en ateliers 216 4.4 Des défis à venir 217 Chapitre 5 : Recommandations, perspectives et conclusions 219 1. Discussion générale 219 1.1. Où en est-on ? 219 1.2. Besoins et perspectives générés par ce travail 220 1.3. Une nécessaire observation normalisée à long terme et à large échelle ... 223 1.4. … Puis le système d’information : a-t-on mis la charrue avant les bœufs ? 223 2. Recommandations [à ce stade] 224 2.1. Recommandations concernant les protocoles 224 2.2. Recommandations concernant l’inter-opération des systèmes d’informations 227 2.3. Recommandations concernant l’utilisabilité, l’utilisation / la réutilisation des données 230 Développer la culture des données et leur « réutilisabilité » 230 Mieux connaître le potentiel des données pour mieux inter-opérer 232 2.4. Recommandations concernant les traitements de données hétérogènes, la fouille de données et les approches par les graphes 233 L’utilisation de la théorie des graphes pour exploiter des données environnementales se précise 233 Quelques recommandations concernant l’initiation aux traitements de données hétérogènes et aux approches par les graphes 233 2.5. Recommandations concernant les facteurs humains 235 La qualité de l’information, une problématique liée aux facteurs humains 235 Une science mieux partagée 237 Des objectifs mieux compris et partagés pour l’aide à la décision 238 Quelle stratégie pour encourager le partage des données et l’augmentation de sa qualité (Rewarding recommendation for Data Sharing) ? 240 2.6. Conclusions sur ces recommandations 244 Références bibliographiques 249 Glossaire 267 Sigles, Acronymes et Abréviations 281 Ressources 286 Annexes 291 Annexe 1 : Articles 291 Articles issus du travail de thèse soumis à / acceptés dans des revues à comité de lecture 291 Autres publications en relation avec le travail de thèse 293 9 Annexe 2 : liste des programmes et responsabilités associées 296 Programmes européens : 296 Financements obtenus dans le cadre du CNRS et responsabilités associées : 296 Autres implications dans des programmes de recherche : 297 Annexe 3 : Programme CIGESMED (Féral et al. 2016) 298 Présentation 298 Librairie de taxons utilisée avec photoquad pour l’analyse des quadrats photo CIGESMED en France 301 Données prétraitées (extrait) 308 Annexe 4 : Programme DEVOTES (Borja, 2017) 309 Présentation 309 Librairie de taxons utilisée avec PhotoQuad pour l’analyse des quadrats photo DEVOTES 310 Données prétraitées des fréquences de taxons issues des analyses ARMS 313 Matériel Supplémentaire 317 Annexe 5 : IndexMed 319 Contexte 319 Des projets chaque année 319 Objectif général 319 Annexe 6 : indexMEED 320 IndexMed est devenu IndexMEED 320 GRAMINÉES , une action labellisée et soutenue par le GDR MaDICS en 2017 et 2018 320 Ce qu’il est envisageable pour la suite 321 A plus long terme 321 Le projet GRAINE, une application concrète des travaux du consortium IndexMEED appliquée aux problématiques « Homme-milieux » 322 Objectifs opérationnels de GRAINE Des OHMs 323 Résultats attendus 323 Annexe 7 : Activité scientifique en support ou en complément du travail de thèse 325 Articles dans une revue 325 Proceedings de communications à un congrès 327 Chapitres d’ouvrage 329 Communications 330 Présentations orales (séminaires internationaux) 330 Co-authoring de présentations orales internationales 334 Présentations orales (séminaires d’audience locale et nationale) 337 Conférence grand public 341 Posters 341 Organisation de séminaires et d’ateliers 349 Rapports liés au travail de thèse 350 Stages co-encadrés avec J.P. Féral pendant la thèse 351 Annexe 8. Résultat des ateliers : document “how to do” sur la curation 352 La curation de données environnementales étape par étape 352 Enjeux et principes de la curation de données 353 Préparer la curation de données nécessite la mise en place d’un protocole 354 Appliquer le protocole de curation de données en vue d’une représentation sous forme de graphes 356 Contrôle qualité de la curation de données 358 En perspective 360 10
Description: