ebook img

Diversité Linguistique et TAL PDF

78 Pages·2017·3.91 MB·French
by  
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Diversité Linguistique et TAL

Actes de l’atelier “ Diversité Linguistique et TAL ” (DiLiTAL 2017) Fadoua Atta-Allah, Fatima Agnaou, Khalid Ansar, Aicha Bouhjar, Siham Boulaknadel, Malika Chakiri, Hammou Fadili, Jamal Frain, Jovan Kostov, Alice Millour, et al. To cite this version: Fadoua Atta-Allah, Fatima Agnaou, Khalid Ansar, Aicha Bouhjar, Siham Boulaknadel, et al.. Actes de l’atelier “ Diversité Linguistique et TAL ” (DiLiTAL 2017). 2017. ￿halshs-01541153￿ HAL Id: halshs-01541153 https://shs.hal.science/halshs-01541153 Submitted on 17 Jun 2017 HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non, lished or not. The documents may come from émanant des établissements d’enseignement et de teaching and research institutions in France or recherche français ou étrangers, des laboratoires abroad, or from public or private research centers. publics ou privés. Distributed under a Creative Commons Attribution - NonCommercial - ShareAlike| 4.0 International License 24e Conférence sur le Traitement Automatique des Langues Naturelles (TALN) Orléans,France–26-30juin2017 https://taln2017.cnrs.fr Actes de l’atelier « Diversité Linguistique et TAL » (DiLiTAL 2017) FadouaAtta-Allah,FatimaAgnaou,KhalidAnsar,AichaBouhjar,Siham Boulaknadel,MalikaChakiri,HammouFadili,JamalFrain,JovanKostov, AliceMillour,SatenikMkhitaryan,MichaelZock(Eds.) Sponsors: Préface Savoircommuniquerestundesfondementsdenossociétés.Nossurviesetnotrecoexistencesont intimementliéesànotrefacultédenousfairecomprendre,cequipeutposerproblèmeàcausedenos différencesculturellesetlinguistiquesetàcausedenosexpériencesdevie,sensibilités,pointsdevue etc.Dansdetrèsnombreuxpays,onpratiqueplusieurslanguesmaisdontlestatutest,généralement, différent(langueofficielle,languerégionale).Cetétatdefaitengendreunegrandedisparitéauniveau des outils et des ressources en traitement automatique des langues (TAL). Dans ce domaine les langues ’mineures/minorées’ sont communément connues sous le nom de «langues peu dotées» (LPD).Onnoteégalementquelesdécideurss’yintéressentgénéralementpeu,cequiestunhandicap incontestableàl’heuredelaglobalisation. Conscientsdecettesituation,cetatelierviseàsusciteruneréflexiondébouchantsurunélargissement destravauxenTALnotammentlapriseencompted’autreslanguesquecelleshabituellementtraitées. Plusprécisément,l’attentionseraportéesurlanaturedesoutilsetressourcesqu’ilyalieudeconcevoir pourlesLPD,commentlescréer,commentformerdesspécialistescapablesdelesélaborer,voire commentassurerl’apprentissagedeceslangues,afindelessauvegarderetlespérennisercomme lepréconisentlesdifférentesinitiativesmisesenplaceparlesgrandesorganisationsinternationales (Nations-Unies,Conseildel’Europe,etc.),pourcomblercettelacune. La nécessité de traiter automatiquement les LPD découle, à la fois, des besoins scientifiques et humanitaires(santé,éducation,culture,littératie,etc.)maiségalementdesenjeuxd’ordrepolitique (accèsàl’informationetàl’enseignement).Acettefin,àtraverslajournéedu26juin2017,l’atelier DiLiTALsedonnepourobjectifnonseulementlasensibilisationdelacommunautéscientifiqueà cesenjeuxetauxdifficultésrencontréesdansletraitementdesLPD,maisaussiàl’intérêtdecréer desoutilsgénériquespermettantdetraiteruntrèsgrandnombredelangues,toutenidentifiantles besoinsspécifiquesenfonctiondesparticularitésdesdifférenteslangues(typologie).Decefait,cette initiativeviseàmettreencommunlesdifférentesméthodesettechniquesutiliséespourdynamiserla constructionetlamutualisationdesressources,ainsiqueletransfertdessavoirsetdessavoir-faire. iii iv Comités Comité de programme MeftahaAmeur(IRCAM,Maroc) DelphineBernhard(LILPA,UniversitédeStrasbourg) LaurentBesacier(LIG,UniversitédeGrenoble-Alpes) SihamBoulaknadel(IRCAM,Maroc) AhmedBoukouss(IRCAM,Maroc) ViolettaCavalli-Sforza(UAI,Maroc) MalikaChakiri(UniversitéParis-Descartes) AntoineChalvin(CREE,INALCO) KhalidChoukri(ELDA) RuteCosta(UNL,Portugal) AnaïdDonabedian(SeDyL,INALCO) HammouFadili(CNAM) MichelFrancard(UCL,Belgique) KimGerdes(LPP,SorbonneNouvelle) ThibautGrouas(DGLFLF) BenaissaIchou(IRCAM,Maroc) Anne-LaureLigozat(LIMSI,CNRS) MathieuMangeot(GETALP,UniversitédeChambéry) JosephMariani(LIMSI,CNRS) DenisMaurel(LI,UniversitédeTours) AzzedineMazroui(FS-Oujda,Maroc) IssoufModi(MEN,Niger) AbdelhakMouradi(MESRSFC,Maroc) KamalNaitZerrad(LACNAD,INALCO) PatricePognan(PLIDAM,INALCO) SophieRosset(LIMSI,CNRS) MaxSilberztein(ELLIADD,UniversitéFranche-Comté) HamidSouifi(IRCAM,Maroc) DejanStosicˇ (ERSS,UniversitédeToulouseJean-Jaurès) v IzabellaThomas(CRIT,UniversitédeFranche-Comté) NoraTigziri(UMMTO,Algérie) MathieuValette(ERTIM,INALCO) FaridaYamouni(UMMTO,Algérie) MichaelZock(LIF,CNRS&AMU) Comité d’organisation FadouaAtaaAllah(IRCAM,Maroc) FatimaAgnaou(IRCAM,Maroc) KhalidAnsar(IRCAM,Maroc) AichaBouhjar(IRCAM,Maroc) SihamBoulaknadel(IRCAM,Maroc) MalikaChakiri(UniversitéParis-Descartes) HammouFadili(CNAM) JamalFrain(IRCAM,Maroc) JovanKostov(PLIDAM,INALCO) AliceMillour(STIH,Paris-Sorbonne) SatenikMkhitaryan(ERTIM,INALCO) MichaelZock(LIF,CNRS&Aix-MarseilleUniversité) vi Table des matières Session«oral» DiLiTAL–DiversitéLinguistiqueetTAL Fadoua Atta-Allah, Fatima Agnaou, Khalid Ansar, Aicha Bouhjar, Siham Boulaknadel, Malika Chakiri,HammouFadili,JamalFrain,JovanKostov,AliceMillour,SatenikMkhitaryan,Michael Zock ...................................................................................1 L’amazighedanslessciencesdunumérique:expériencedel’IRCAM FatimaAgnaou,KhalidAnsar,FadouaAtaaAllah,AichaBouhjar,SihamBoulaknadel .........4 ProblèmesdetokénisationpourdeuxlanguesrégionalesdeFrance,l’alsacienetlepicard DelphineBernhard,AmaliaTodirascu,FannyMartin,PascaleErhart,LucieSteiblé,Dominique Huck,ChristopheRey ..................................................................14 Produiredesressourcesélectroniquesàpartirdedescriptionsformelles:applicationauxlangues peudotées DenysDuchier,YannickParmentier,SimonPetitjean,EmmanuelSchang .....................24 Retourd’expérience:l’utilisationdel’apprentissageprofond(deeplearning)danslecontextede l’analysesémantiquedeslanguespeudotées HammouFadili ........................................................................33 Expériencesd’étiquetagemorphosyntaxiquedanslecadreduprojetRESTAURE PierreMagistry,Anne-LaureLigozat,SophieRosset .......................................45 LeschaînescoréférentiellesencréoledelaGuadeloupe EmmanuelSchang,Jean-YvesAntoine,AnaïsLefeuvre-Halftermeyer ........................54 Constitutiond’uncorpusd’arabetunisienparléàOrléans YoussraBenAhmed ....................................................................62 vii viii Actesdel’atelier«DiversitéLinguistiqueetTAL»(DiLiTAL2017) DiLiTAL – Diversité linguistique et TAL Fadoua Atta-Allah1, Fatima Agnaou2, Khalid Ansar3, Aicha Bouhjar2, Siham Boulaknadel1, Malika Chakiri4, Hammou Fadili5, Jamal Frain1, Jovan Kostov6, 7, Alice Millour8, Satenik Mkhitaryan9, Michael Zock10 (1) CEISIC, IRCAM, Rabat, Maroc (2) CRDPP, IRCAM, Rabat, Maroc (3) CAL, IRCAM, Rabat, Maroc (4) Université Paris Descartes, 12, rue de l’Ecole de Médecine, 75006, Paris (5) Laboratoire CEDRIC - CNAM, 2, rue Conté, 75003, Paris (6) E.A. 4154 PLIDAM - INALCO, 2, rue de Lille, 75007, Paris (7) PERL - USPC, 8, place Paul Ricœur, 75013, Paris (8) E.A. 4509 STIH – Université Paris Sorbonne, 1, rue Victor Cousin, 75005, Paris (9) E.A. 2520 ERTIM – INALCO, 2, rue de Lille, 75007, Paris (10) LIF – UMR 7279, 163, avenue de Luminy, F-13288, Marseille {agnaou,ansar,ataaallah,bouhjar,boulaknadel,frain}@ircam.ma, [email protected], [email protected], alice.millour@paris- sorbonne.fr, [email protected], [email protected] RESUME L’atelier DiLiTAL se donne pour objectif de sensibiliser la communauté́ scientifique non seulement aux enjeux et aux difficultés rencontrées dans le traitement des langues peu dotées (LPD), mais aussi à l’intérêt de créer des outils génériques permettant de traiter un très grand nombre de langues, tout en identifiant les besoins spécifiques en fonction de leurs particularités. Cet atelier vise à mettre en commun les différentes méthodes et techniques utilisées pour dynamiser la construction et la mutualisation des ressources, ainsi que le transfert des savoirs et des savoir-faire. ABSTRACT Workshop Linguistic diversity and NLP - DiLiTAL The goal of the DiLiTAL workshop is to raise awareness among the scientific community of the issues and difficulties encountered in the processing of under-resourced languages (ULL). We also want to point out the necessity of creating generic tools in order to process a large number of languages by identifying their particularities. This workshop’s aim is to pool the different methods and techniques used to boost the construction of resources, as well as the transfer of knowledge and experience in the processing of under-resourced languages. MOTS-CLES : langues peu dotées, diversité, linguistique, TAL. KEYWORDS: less resourced languages, diversity, linguistics, NLP. 1

Description:
Ahmed Boukouss (IRCAM, Maroc) L'amazighe dans les sciences du numérique : expérience de l'IRCAM. Fatima Agnaou .. cas pour toutes les langues (Ameur et Boumalk, 2004 ; Boukous, 2007 ; Agnaou, 2009). Après une étude approfondie du système phonético-phonologique des différentes.
See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.