PFIA 2015 Plateforme Intelligence Artificielle Rennes Actes IC Président CP : Marie-Hélène Abel 26es Journées Francophones d’Ingénierie des Connaissances Vers le traitement de la masse des données disponibles sur le Web Présentation de la conférence Organisée chaque année depuis 1997 sous l’égide du GRACQ (Groupe de Recherche en Acquisition des Connaissances) puisducollègeICdel’AFIA,lesjournéesfrancophonesd’IngénieriedesConnaissances(IC)constituentunlieud’échangeset deréflexionsdelacommunautéfrancophoneacadémiqueetindustriellesurlesconcepts,méthodesettechniquespermettant de modéliser et d’acquérir les connaissances dans des domaines peu ou pas formalisés. Ces concepts, méthodes et techniques progressent au rythme de l’évolution des usages et des technologies. Les Tech- nologies de l’Information et de la Communication, le web social, le web des données ont ainsi engendré des mutations des pratiques individuelles et collectives. L’arrivée de l’internet des objets a permis l’émergence d’un web des objets visant la communication entre objets connectés et leur lien avec des acteurs humains. Aujourd’hui, plus que jamais, de nombreuses données, informations, sources de connaissances sont produites. Il est donc naturel de s’interroger sur leur exploitation (représentation,interprétation,gestion,diffusion,partage,visualisation,etc.)etsurlesoutils,méthodes,modèles,standards permettant leurs traitements. Les 26es journées francophones d’Ingénierie des Connaissances se déroulent dans le cadre de la plate-forme de l’Intelli- gence Artificielle PFIA 2015. Le comité de programme de cette édition 2015 a permis d’accueillir des représentants de 11 pays francophones. Cette éditionarecueillicinquanteintentionsdesoumissionpourfinalement46articleslongset2articlescourtsdéposésprovenant de 8 pays. Parmi ces soumissions, 19 articles longs ont été retenus, 6 ont été retenus en papiers courts. 6 démonstrations ont également été soumises et retenues pour être présentées dans une session partagée par les conférences hébergées par la plate-forme PFIA2015. Les thèmes abordés ont été variés et recouvrent bien l’ensemble des préoccupations de la com- munauté concernant l’exploitation de données, d’informations, de sources de connaissances et la définition des outils, des méthodes,etdesmodèlesvisantletraitementdeconnaissances.Al’issuedecetteédition,unedemanded’extensiond’article sera proposée à une sélection des meilleures contributions de IC2014 et IC2015 pour soumission à un numéro spécial de la Revue d’Intelligence Artificielle. Je remercie le bureau du collège de l’AFIA de m’avoir offert l’opportunité de présider ces 26èmes journées. Je remercie chaleureusement Jean-Luc Vuillaume (Altran) d’avoir accepté d’être notre conférencier invité et de partager avec la com- munauté son expérience de consultant sénior en knowledge management. Je remercie également les différents contributeurs qui font de ces journées un évènement majeur pour la communauté d’ingénierie des connaissances : auteurs, membres du comitédeprogramme,participants.JeremercieenfinNathalieAussenac-Gilles,JeanCharletetCatherineFaronZuckerpour leurs nombreux conseils qui m’ont permis de mener au mieux ma mission, ainsi que les membres du comité d’organisation de la plate-forme PFIA2015 pour leur disponibilité. Marie-Hélène Abel Présidente du comité de programme de IC2015 Conférencier Invité : Jean-Luc Vuillaume (Altran France) Biographie Jean-Luc Vuillaume est consultant et formateur chez Altran/CIS. En partant d’une double compétence «Organisation d’entreprise et Gestion de la connaissance », J.-L. Vuillaume a acquis une très bonne expérience en modélisation des connaissances et des compétences dans le cadre des stratégies de gestion des connaissances (Knowledge Management) et de conception pédagogique. J.-L. Vuillaume s’intéresse en particulier à la conception de dispositifs pédagogiques pour la formation professionnelle continue et à l’élaboration de modélisation de processus. Pérennisation de la connaissance via un Electronic Performance Support System (EPSS) La société MBDA (Groupe EADS) fait partie du secteur de l’armement et emploie 10.000 personnes. Il y a 6 ans les questions de la pérennisation et de la capitalisation de la connaissance liée aux applications informatique ont été posées aux Responsable des Système d’Informatique et de la formation. Le retour d’expérience que je vous propose de partager correspond à la mise en place d’une base de connaissances pendant les 6 années qui ont suivi. Je commencerai par la présentation du contexte et l’explicitation des questions posées après 10 ans de déploiement informatique par les salariés après une étude de satisfaction. J’aborderai la réflexion que nous avons eue sur la notion de connaissance,d’apprentissageetdecompétence.Celle-cinousaamenéàlamiseenplaced’unEPSS(ElectronicPerformance SupportSystem)quejedéfiniraiainsiquel’organisationinformatique,organisationnelleetdeproductionquenousavonsmise en place. Je ferai ensuite un bilan sur la bibliothèque de connaissance applicative métier créée pour finir par les perspectives envisageables dans les prochaines années. Comité de Programme Présidente du comité de programme Marie-Hélène Abel, Université de Technologie de Compiègne, UMR CNRS 7253 Heudiasyc Membres du comité de programme — Xavier Aimé, INSERM, France — Yamine Ait Ameur, INPT-ENSEEIHT, Toulouse - IRIT, France — Patrick Albert, IBM France — Florence Amardeilh, Mondeca, France — Nathalie Aussenac-Gilles, CNRS - IRIT, France — Bruno Bachimont, Université de Technologie de Compiègne - Heudiasyc, France — Jean-Paul Barthès, Université de Technologie de Compiègne - Heudiasyc, France — Sadok Ben Yahia, Faculté des Sciences de Tunis, Tunisie — Aurélien Bénel, Université de Technologie de Troyes - ICD/Tech-CICO, France — Nacéra Bennacer, SUPELEC - E3S, France — Bertrand Braunschweig, INRIA Rennes-Bretagne Atlantique, France — Patrice Buche, INRA- IAT/LIRMM, France — Elena Cabrio, INRIA Sophia Antipolis, France — Jean-Pierre Cahier, Université de Technologie de Troyes - ICD/Tech-CICO, France — Sylvie Calabretto, Institut National des Sciences Appliquées de Lyon - LIRIS, France — Pierre-Antoine Champin, Université Claude Bernard Lyon 1 - LIRIS, France — Jean Charlet, Université Pierre et Marie Curie - INSERM U1142 - LIMICS, France — Olivier Corby, INRIA Sophia Antipolis, France — Amélie Cordier, Université Claude Bernard Lyon 1 – LIRIS, France — Michel Crampes, Ecole des Mines d’Ales - LGI2P, France — Philippe Cudré-Mauroux, Université de Fribourg, Suisse — Olivier Curé, Université Pierre et Marie Curie – LIP6, France — Célia Da Costa Pereira, Université Nice Sophia Antipolis - I3S, France — Mathieu D’Aquin, The Open University - Grande Bretagne — Jérôme David, Université Pierre-Mendès-France - LIG, France — Rim Djedidi, Université Paris 13 - LIMICS, France — Jean-Pierre Evain, EBU, Suisse — Gilles Falquet, Université de Genève, Suisse — Catherine Faron Zucker, Université Nice Sophia Antipolis - I3S, France — Cécile Favre, Université Lyon 2 - ERIC, France — Béatrice Fuchs, Université Jean Moulin Lyon 3 - LIRIS, France — Frédéric Fürst, Université de Picardie Jules Verne - MIS, France — Jean-Gabriel Ganascia, Université Pierre et Marie Curie - LIP6, France — Fabien Gandon, INRIA Sophia Antipolis, France — Aldo Gangemi, Université Paris 13 - LIPN, France — Catherine Garbay, CNRS - LIG, France — Faïez Gargouri, Université de Sfax - ISIMS-Miracl, Tunisie — Serge Garlatti, Telecom Bretagne - Labsticc, France — Alain Giboin, INRIA Sophia Antipolis, France — Monique Grandbastien, Université de Lorraine, LORIA, France — Christophe Guéret, Data Archiving and Networked Services - DANS/KNAW, La Haye, Pays-Bas — Ollivier Haemmerlé, Université de Toulouse Jean Jaurès - IRIT, France — Mounira Harzallah, IUT de Nantes - LINA, France — Nathalie Hernandez, Université de Toulouse Le Mirail - IRIT, France — Antoine Isaac, Europeana & Vrije Universiteit Amsterdam, Pays-Bas — Marie-Christine Jaulent, INSERM U1142 - LIMICS, France — Clément Jonquet, Université de Montpellier - LIRMM, France — Nadjet Kamel, Université de Sétif, Algérie — Gilles Kassel, Université de Picardie Jules Verne - MIS, France — Khaled Khelif, Airbus Defence and Space, France — Pascale Kuntz, Université de Nantes - LINA, France — Philippe Laublet, Université Paris Sorbonne - STIH, France — Florence Le Ber, Université de Strasbourg /ENGEES - ICube, France — Michel Leclère, Université Montpellier 2 - LIRMM, France — Alain Léger, Orange Labs, France — Dominique Lenne, Université de Technologie de Compiègne, Heudiasyc, France — Moussa Lo, Université Gaston Berger, Sénégal — Jean-Charles Marty, Université de Savoie - LIRIS, France — Nada Matta, Université de Technologie de Troyes – ICD/Tech-CICO, France — Alain Mille, Université Claude Bernard Lyon 1 - LIRIS, France — Pascal Molli, Université de Nantes - LINA, France — Alexandre Monnin, INRIA – Sophia Antipolis, France — Claude Moulin, Université de Technologie de Compiègne, Heudiasyc, France — Amedeo Napoli, CNRS - LORIA, France — Emmanuel Nauer, Université de Lorraine - LORIA, France — Jérôme Nobécourt, Université Paris 13 - LIMICS, France — Gilbert Paquette, Télé-université - LICEF, Canada — Alexandre Passant, mdg.io, Irelande — Nathalie Pernelle, Université Paris 11 - LRI, France — Yannick Prié, Université de Nantes - LINA, France — Cédric Priski, LIST, Luxembourg — Sylvie Ranwez, Ecole des Mines d’Ales - LGI2P, France — Chantal Reynaud, Université Paris-Sud - LRI, France — Roger Roberts, RTBF, Belgique — Catherine Roussey, Irstea, France — Pascal Salembier, Université de Technologie de Troyes - ICD/Tech-CICO, France — Francois Scharffe, Université de Montpellier 2 - 3Top, France — Karim Sehaba, Université Lumière Lyon 2 - LIRIS, France — Hassina Seridi, Université Badji Mokhtar-Annaba, Algérie — Nathalie Souf, Université Paul Sabatier Toulouse - IRIT, France — Milan Stankovic, Université Paris-Sorbonne - Sépage & STIH, France — Sylvie Szulman, Université Paris 13 - LIPN, France — Eddie Soulier, Université de Technologie de Troyes – ICD/Tech-CICO, France — Andrea Tettamanzi, Université Nice Sophia Antipolis - I3S, France — Yannick Toussaint, INRIA Nancy Grand-Est - LORIA, France — Francky Trichet, Université de Nantes - LINA, France — Cassia Trojahn, Université de Toulouse Le Mirail - IRIT, France — Raphaël Troncy, EURECOM, France — Pierre-Yves Vandenbussche, Fujitsu Limited Ireland, Irelande — Serena Villata, INRIA Sophia Antipolis, France — Amel Yessad, Université Paris 6 - Laboratoire LIP6, France — Haifa Zargayouna, Université Paris 13 - LIPN, France — Antoine Zimmermann, École des Mines de Saint-Étienne, France — Pierre Zweigenbaum, CNRS - LIMSI, France Table des matières Méthodes et outils d’acquisition des connaissances MikeDonaldTapiNzali,SandraBringay,ChristianLavergne,ThomasOpitz,JérômeAzéandCarolineMollevi. Acquisition du vocabulaire patient/médecin présent dans les forums de santé 9 Mohamed Besnaci, Nathalie Guin and Pierre-Antoine Champin. Acquisition de connaissances pour importer des traces existantes dans un système de gestion de bases de traces 21 Assitan Traore, Alain Mille and Hélène Tattegrain. Assistance à la découverte de connaissances contextuelles à partir de l’analyse des traces 33 Benjamin Hervy, Matthieu Quantin, Florent Laroche, Alain Bernard and Jean-Louis Kerouanton. Gestion de connaissances pour l’acquisition, le traitement et la valorisation des connaissances du patrimoine technique 45 Ontologie I Nada Mimouni, Adeline Nazarenko and Sylvie Salotti. Une ontologie documentaire pour l’accès aux contenus juridiques 57 Sebastien Ferre. Conception interactive d’ontologies par élimination de mondes possibles 69 Papa Fary Diallo, Olivier Corby, Isabelle Mirbel, Moussa Lo and Seydina Moussa Ndiaye. HuTO : une Ontologie Temporelle Narrative pour les Applications du Web Sémantique 75 Mohamed Lamine DiakitÉ and Béatrice Bouchou Markhoff. Construction semi-automatique d’une ontologie sur des manuscrits ouest sahariens 87 Web sémantique, web 2.0, web des données, web des objets et appli- cations à base de connaissances Olivier Corby and Catherine Faron Zucker. Un navigateur pour les données liées du Web 93 Nicolas Seydoux, Mahdi Ben Alaya, Nathalie Hernandez, Thierry Monteil and Ollivier Haemmerlé. Sémantique et Internet des objets : d’un état de l’art à une ontologie modulaire 105 Mohamed Ramzi Haddad, Hajer Baazaoui, Djemel Ziou and Henda Ben Ghezala. Un modèle de recommandation contextuel pour la prédiction des intérêts des consommateurs sur le Web 117 Langages, méthodes et outils pour la gestion des connaissances Yaya Traore, Sadouanouan Malo, Cheikh Talibouya Diop, Moussa Lo and Stanislas Ouaro. Approche de découverte de nouvelles catégories dans un wiki sémantique basée sur les motifs fré- quents 129 Esther Nicart, Bruno Zanuttini, Bruno Grilhères and Patrick Giroux. Amélioration continue d’une chaîne de traitement de documents avec l’apprentissage par renforce- ment 135 Rafik Abbes, Nathalie Hernandez, Karen Pinel-Sauvagnat and Mohand Boughanem. Détection d’informations vitales pour la mise à jour de bases de connaissance 147 Bryan Kong Win Chang, Marie Lefevre, Nathalie Guin and Pierre-Antoine Champin. SPARE-LNC:unlangagenaturelcontrôlépourl’interrogationdetracesd’interactionsstockéesdans IC 2015 une base RDF 159 Représentation des connaissances : manipulation Guillaume Surroca, Philippe Lemoisson, Clment Jonquet and Stefano A. Cerri. Diffusion de systèmes de préférence par confrontation de points de vue, vers une simulation de la Sérendipité 171 Chloé Cabot, Lina F. Soualmia and Darmoni Stefan. Intégration de données cliniques et omiques pour la recherche d’information dans le Dossier Patient Informatisé 183 Jean-Baptiste Lamy and Hélène Berthelot. Ontopy : programmation orientée ontologie en Python 195 Fabien Amarger, Jean-Pierre Chanet, Ollivier Haemmerlé, Nathalie Hernandez and Catherine Roussey. Transformation de sources non ontologiques en bases de connaissances : incompatibilités entre can- didats 201 Ontologie II Marion Richard, Xavier Aimé, Marie-Odile Krebs and Jean Charlet. LOVMI : vers une méthode interactive pour la validation d’ontologies 207 Jean-François Viaud, Karell Bertet, Christophe Demko and Rokia Missaoui. Décomposition sous-directe d’un treillis en facteurs irréductibles 219 Nathalie Pernelle, Danai Symeonidou and Fatiha Saïs. C-SAKey : une approche de découverte de clés conditionnelles dans des données RDF 231 Xavier Aimé. Eléments de réflexion sur l’utilisation de corpus pour la construction d’ontologies 237 Traitement et raisonnement sur les connaissances Michel Plantié and Michel Crampes. Complémentarité de personnes partageant des propriétés dans les Réseaux Sociaux 249 Naïma El-Kechaï, Javier Melero and Jean-Marc Labat. Quelquesenseignementstirésdel’applicationdelaCompetence-basedKnowledgeSpaceTheoryaux Serious Games 259 Démonstrations Ala Atrash and Marie-Hélène Abel. MEMORAe : Plateforme web pour supporter l’annotation collaborative 271 Pierre-Loup Barazzutti, Amélie Cordier and Béatrice Fuchs. Un outil d’extraction interactive de connaissances à partir de traces : Transmute 273 Sébastien Ferré. PEW : un outil d’aide à la conception d’ontologies par l’exploration des mondes possibles 275 Maxime Lefrançois and Antoine Zimmermann. LinkedVocabularyEditor : une extension MediaWiki pour l’édition collaborative et la publication de vocabulaires liés 277 Mohamed Nader Jelassi, Sadok Ben Yahia and Engelbert Mephu Nguifo. PERSOREC : un système personnalisé de recommandations pour les folksonomies basé sur les concepts quadratiques 279 – 7 – IC 2015 Jessica Pinaire, Soumaya Ben Alouane, Jérôme Azé, Sandra Bringay, Paul Landais, Arnaud Sallaberry. Visualisation interactive de trajectoires de patients 281 – 8 – IC 2015 – Acquisition du vocabulaire patient/médecin présent dans les forums de santé Acquisitiondevocabulairepatient/médecinvialesmédiassociaux Construction d’un vocabulaire patient/médecin dédié au cancer du sein à partir des médias sociaux Mike Donald Tapi Nzali1,2, Sandra Bringay2,3, Christian Lavergne1,3, Thomas Opitz4, Jérôme Azé2, Caroline Mollevi5 1 I3M,UniversitéMontpellier,France [email protected],[email protected] 2 LIRMM,UniversitéMontpellier,France [email protected],[email protected] 3 UniversitéPaulValeryMontpellier,France 4 BiostatistiqueetProcessusSpatiaux(BioSP),INRAAvignon,France [email protected] 5 Unitédebiostatistique,InstitutdeCancérologiedeMontpellier,France [email protected] Résumé :Denosjours,lesmédiassociauxsontdeplusenplusutilisésparlespatientsetlesprofessionnels de santé.Les patients, généralement profanes dansle domaine médical,utilisent de l’argot,des abréviations etunvocabulairequileurestproprelorsdeleurséchanges.Pouranalyserautomatiquementlestextesdesré- seaux sociaux, l’acquisition de ce vocabulaire spécifique est nécessaire. En nous appuyant sur un corpus de documentsissusdemessagesdemédiassociauxdetypeforumsetFacebook,nousdécrivonslaconstruction d’uneressourcelexicalequialignelevocabulairedespatientsàceluidesprofessionnelsdesanté.Cetravailper- mettra,d’unepartd’améliorerlarecherched’informationsdanslesforumsdesantéetd’autrepart,defaciliter l’élaborationd’étudesstatistiquesbaséessurlesinformationsextraitesdecesforums. Mots-clés:Extractiond’information,Médiassociaux,Vocabulairepatient 1 Introduction Les vocabulaires contrôlés (e.g. SNOMED, MeSH, UMLS, etc.) jouent un rôle clé dans les applications biomédicales de fouille de textes. Ces vocabulaires contiennent seulement les termes utilisés par les professionnels de santé. Depuis 10 ans, des vocabulaires dédiés aux consommateurs de soins de santé (Consumer Health Vocabularies - CHV), ont également été crées (Zeng & Tse, 2006). Ces CHV lient des mots de tous les jours se rapportant au domaine delasantéàdesmotsd’argottechniqueutilisésparlesprofessionnelsdesanté. Danscetarticle,nousproposonsuneméthodesemi-automatiquepourconstruireuntelCHV pour la langue française. Par exemple, nous cherchons à relier le mot "onco" utilisé par les pa- tients à "oncologue" utilisé par les professionnels de santé. L’originalité de notre approche est d’utiliser les textes rédigés par les patients (PAT Patient-Authored Text), provenant des mes- sagesissusdesmédiassociauxdetypeforumsouFacebook,ainsiquelastructuredel’encyclo- pédieuniversellecollaborativeWikipédia.Notreméthodeaétéexpérimentéeavecsuccèssurun jeu de données réelles dans le domaine du cancer du sein. Elle a été validée automatiquement en utilisant la ressource collaborative du site JeuxDeMots.org. Une validation manuelle a été égalementréaliséepar4personnes,dontunexpertdudomaineducancerdusein. Cetarticleestorganisécommesuit.Danslasection2,nousmotivonsnotretravailetdonnons un état de l’art rapide. Dans la section 3, nous décrivons chaque étape de la méthode. Dans la – 9 – IC 2015 – Acquisition du vocabulaire patient/médecin présent dans les forums de santé IC2015 section 4, nous présentons le cadre expérimental utilisé pour évaluer les performances de cette méthode. Dans la section 5, nous discutons des premiers résultats. Finalement, dans la section 6,nousconcluonsetdonnonsquelquesperspectivesàcestravaux. 2 Motivationsetétatdel’art Selonuneenquêteréaliséeen2011parlafondationHON1,Internetestdevenuladeuxième source d’information des patients après les consultations chez les médecins. 24% de la popula- tion utilise Internet pour trouver des informations sur leur santé au moins une fois par jour (et jusqu’à 6 fois par jour) et 25% au moins plusieurs fois par semaine. Ces «patients 2.0» sont motivés par un accès facile à Internet à domicile, le manque général de temps pour des consul- tations plus classiques, un soutien humain (surtout pour les maladies chroniques), la nécessité de connaître les expériences des autres, ainsi que le désir d’obtenir plus d’informations avant ou après une consultation (Hancock et al., 2007; Merolli et al., 2013). En maintenant l’anony- mat,cesmédiassociaux(forums,groupesFacebook)leurpermettentdediscuterlibrementavec d’autres utilisateurs, usagers, personnes, et aussi avec des professionnels de santé. Ils parlent de leurs résultats médicaux et de leurs options de traitement, mais ils reçoivent également un soutienmoral. Dans des travaux précédents (Opitz et al., 2014), nous nous sommes intéressés à l’étude de la qualité de vie des patientes atteintes d’un cancer du sein à partir des médias sociaux. Nous avons cherché à capturer et quantifier ce que les patientes expriment dans les forums à propos deleurqualitédevie.Uneimportantelimitationàcestravauxvientdutypedetextestraités.En effet,laplupartdespatientssontdesprofanesdansledomainemédical.Lorsdeleurséchanges, ils utilisent des mots d’argot, des abréviations et un vocabulaire spécifique construit par la communauté en ligne, à la place des termes médicaux que l’on retrouve dans les ressources terminologiques utilisées par les professionnels de santé comme la SNOMED (Nomenclature systématiséedemédecine)2,leMeSH(MedicalSubjectHeadings)3,l’UMLS(UnifiedMedical LanguageSystem)4.Lesméthodesdefouilledetextesmisesenœuvreontmontréleurslimites à cause de ce vocabulaire particulier. Nous nous proposons donc dans cet article de construire un vocabulaire dédié aux «consommateurs de soins de santé» (Consumer Health Vocabularies -CHV). Initialement, la création de ces CHV a été motivée par la réduction des écarts de connais- sancesentrelespatientsetlesprofessionnelsdesanté(Zengetal.,2007).Eneffet,lalittérature montre que la compréhension par les patients de la terminologie médicale est essentielle pour appréhender leur maladie et pour participer au processus de décision médicale. En outre, les communications réussies patient-médecin sont intrinsèquement liées à la confiance que le pa- tient a envers son médecin (Fiscella et al., 2004). S’il ne comprend pas de quoi le médecin lui parle, le patient est moins enclin à lui faire confiance. Certains chercheurs ont ainsi utilisé des CHV pour améliorer la lisibilité des documents médicaux (Wu et al., 2013) ou du dossier patient électronique (Ramesh et al., 2013) par les non-experts. (Doing-Harris & Zeng-Treitler, 1. HON(HealthOntheNet)HowDoGeneralPublicSearchOnlineHealthInformation?Avril2011 2. http://www.nlm.nih.gov/research/umls/Snomed/snomed_main.html 3. http://mesh.inserm.fr/mesh/ 4. http://www.nlm.nih.gov/research/umls/ – 10 –
Description: