ebook img

The Italian Language in the Digital Age PDF

74 Pages·2012·1.364 MB·
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview The Italian Language in the Digital Age

WhitePaperSeries CollanaLibriBianchi THE ITALIAN LA LINGUA LANGUAGE IN ITALIANA THE DIGITAL NELL’ERA AGE DIGITALE Nicoletta Calzolari CNR-ILC Bernardo Magnini FBK Claudia Soria CNR-ILC Manuela Speranza FBK GeorgRehm,HansUszkoreit (curatori,editors) Editors Georg Rehm HansUszkoreit DFKI DFKI Alt-Moabit 91c Alt-Moabit 91c Berlin 10559 Berlin 10559 Germany Germany e-mail: [email protected] e-mail: [email protected] ISSN 2194-1416 ISSN 2194-1424 (electronic) ISBN 978-3-642-30775-1 ISBN 978-3-642-30776-8 (eBook) DOI 10.1007/978-3-642-30776-8 Springer Heidelberg NewYork Dordrecht London LibraryofCongressControlNumber:2012942722 (cid:2)Springer-VerlagBerlinHeidelberg2012 Thisworkissubjecttocopyright.AllrightsarereservedbythePublisher,whetherthewholeorpartofthematerialis concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation, broadcasting, reproduction on microfilms or in any other physical way, and transmission or information storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology now known or hereafter developed.Exemptedfromthislegalreservationarebriefexcerptsinconnectionwithreviewsorscholarlyanalysis ormaterialsuppliedspecificallyforthepurposeofbeingenteredandexecutedonacomputersystem,forexclusive use by the purchaser of the work. Duplication of this publication or parts thereof is permitted only under the provisions of the Copyright Law of the Publisher’s location, in its current version, and permission for use must always be obtained from Springer. Permissions for use may be obtained through RightsLink at the Copyright ClearanceCenter.ViolationsareliabletoprosecutionundertherespectiveCopyrightLaw. Theuseofgeneraldescriptivenames,registerednames,trademarks,servicemarks,etc.inthispublicationdoesnot imply,evenintheabsenceofaspecificstatement,thatsuchnamesareexemptfromtherelevantprotectivelawsand regulationsandthereforefreeforgeneraluse. Whiletheadviceandinformationinthisbookarebelievedtobetrueandaccurateatthedateofpublication,neither theauthorsnortheeditorsnorthepublishercanacceptanylegalresponsibilityforanyerrorsoromissionsthatmay bemade.Thepublishermakesnowarranty,expressorimplied,withrespecttothematerialcontainedherein. Printedonacid-freepaper SpringerispartofSpringerScience+BusinessMedia(www.springer.com) PREFAZIONE PREFACE uestoLibroBiancofapartediunacollanacheinten- is white paper is part of a series that promotes depromuoverelaconoscenzainmeritoalletecnologie knowledgeaboutlanguagetechnologyanditspoten- dellinguaggioealloropotenziale.Sirivolge,traglial- tial.Itaddressesjournalists,politicians,languagecom- tri, ai giornalisti, i politici, gli educatori e le comuni- munities, educators and others. e availability and tàlinguistiche.Ladisponibilitàel’usodelletecnologie use of language technology in Europe varies between dellinguaggioinEuropavarianodalinguaalingua,e languages.Consequently,theactionsthatarerequired di conseguenza differiscono anche le azioni richieste to further support research and development of lan- persostenerelaricercaelosviluppoditalitecnologie. guage technologies also differ. e required actions Gliinterventinecessaridipendonodamoltifattori,tra depend on many factors, such as the complexity of a iqualilacomplessitàdiciascunalinguaeledimensioni givenlanguageandthesizeofitscommunity. dellacomunitàchevifariferimento. META-NET,aNetworkofExcellencefundedbythe META-NET, una Rete di Eccellenza finanziata dalla European Commission, has conducted an analysis of Commissione Europea, con questa Collana di Libri current language resources and technologies in this Bianchihacondottoun’analisidellerisorseedelletec- whitepaperseries(p.69). eanalysisfocusedonthe nologielinguisticheattualmenteesistenti(p.69).L’a- 23officialEuropeanlanguagesaswellasotherimpor- nalisisièconcentratasulle23lingueeuropeeufficiali tantnationalandregionallanguagesinEurope.ere- esualtreimportantilinguenazionalieregionalid’Eu- sultsofthisanalysissuggestthattherearetremendous ropa.Irisultatidiquestaanalisiindicanochepertut- deficitsintechnologysupportandsignificantresearch telelingueconsiderateesistonodeideficittecnologi- gapsforeachlanguage.egivendetailedexpertanal- ci enormi e significative lacune nella ricerca. L’analisi ysis and assessment of the current situation will help dettagliatachevienefornita,insiemeaunavalutazione maximisetheimpactofadditionalresearch. dellasituazioneattuale,potràconsentiredimassimiz- As of November 2011, META-NET consists of 54 zarel’impattodellericerchefuture. research centres in 33 European countries (p. 65). A novembre 2011, META-NET è composta da 54 META-NETisworkingwithstakeholdersfromecon- centridiricerca,dislocatiin33paesieuropei(p.65). omy (soware companies, technology providers and META-NETcollaboraconaziendecommerciali,enti users), government agencies, research organisations, governativi, industrie, organizzazioni di ricerca, com- non-governmentalorganisations, languagecommuni- pagnieproduttricidisowareeuniversitàeuropee.In- ties and European universities. Together with these siemeaquestecomunità,META-NETstacreandouna communities,META-NETiscreatingacommontech- visionecomunesullatecnologiaeun’agendadiricerca nologyvisionandstrategicresearchagendaformulti- strategicacondivisaperl’Europamultilinguedel2020. lingualEurope2020. III META-NET–offi[email protected]–http://www.meta-net.eu GliautoridiquestodocumentosonogratiagliautoridelLibro e authors of this document are grateful to the authors of Biancosullalinguatedescaperaverconsentitodiriutilizzare theWhitePaperonGermanforpermissiontore-useselected alcunimaterialiselezionatidallorodocumento[1]. language-independentmaterialsfromtheirdocument[1]. uestoLibroBiancoèstatofinanziatodalSettimoProgram- edevelopmentofthisWhitePaperhasbeenfundedbythe mauadroedalProgrammadisostegnoallapoliticainma- SeventhFrameworkProgrammeandtheICTPolicySupport teriadiTIC(tecnologiedell’informazioneedellecomunica- ProgrammeoftheEuropeanCommissionunderthecontracts zioni) della Commissione Europea nell’ambito dei contratti T4ME (Grant Agreement 249119), CESAR (Grant Agree- T4ME(accordodifinanziamento249119),CESAR(accor- ment 271022), METANET4U (Grant Agreement 270893) dodifinanziamento271022),METANET4U(accordodifi- andMETA-NORD(GrantAgreement270899). nanziamento270893)eMETA-NORD(accordodifinanzia- mento270899). IV INDICE CONTENTS LA LINGUA ITALIANA NELL’ERA DIGITALE 1 Sommario 1 2 Lenostrelinguearischio:Unasfidaperletecnologiedellinguaggio 4 2.1 Iconfinilinguisticifrenanolasocietàeuropeadell'Informazione . . . . . . . . . . . . . . . . . . . 5 2.2 Lenostrelinguearischio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.3 Latecnologiadellinguaggioèunatecnologiafondamentale . . . . . . . . . . . . . . . . . . . . 6 2.4 Leopportunitàperletecnologielinguistiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.5 Lesfidedelletecnologielinguistiche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 2.6 L'acquisizionedellinguaggionegliumanienellemacchine . . . . . . . . . . . . . . . . . . . . . 8 3 Lalinguaitaliananellasocietàeuropeadell'informazione 10 3.1 Aspettigenerali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.2 Particolaritàdellalinguaitaliana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.3 Sviluppirecenti . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.4 Iniziativeperlapromozionedellalinguaitaliana . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3.5 Lalinguanelsettoredellaformazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3.6 L'italianosuInternet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 4 Letecnologielinguisticheperl'italiano 14 4.1 Architettureapplicative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4.2 Ambitiapplicativiprincipali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 4.3 Altreareeapplicative . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 4.4 Programmiformativi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 4.5 Progettieiniziativenazionali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 4.6 Disponibilitàdistrumentierisorse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.7 Confrontofralelingue . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.8 Conclusioni . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 5 META-NET 32 THE ITALIAN LANGUAGE IN THE DIGITAL AGE 1 ExecutiveSummary 33 2 LanguagesatRisk:aChallengeforLanguageTechnology 36 2.1 LanguageBordersHoldbacktheEuropeanInformationSociety . . . . . . . . . . . . . . . . . . 37 2.2 OurLanguagesatRisk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 2.3 LanguageTechnologyisaKeyEnablingTechnology . . . . . . . . . . . . . . . . . . . . . . . . 37 2.4 OpportunitiesforLanguageTechnology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38 2.5 ChallengesFacingLanguageTechnology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.6 LanguageAcquisitioninHumansandMachines . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 3 TheItalianLanguageintheEuropeanInformationSociety 41 3.1 GeneralFacts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.2 ParticularitiesoftheItalianLanguage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3.3 RecentDevelopments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 3.4 OfficialLanguageProtectioninItaly . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.5 LanguageinEducation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.6 ItalianontheInternet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4 LanguageTechnologySupportforItalian 45 4.1 ApplicationArchitectures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 4.2 CoreApplicationAreas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 4.3 OtherApplicationAreas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52 4.4 EducationalProgrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.5 NationalProjectsandInitiatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.6 AvailabilityofToolsandResources . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.7 Cross-languagecomparison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 4.8 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 5 AboutMETA-NET 61 A Riferimentibibliografici--References 63 B MembridiMETA-NET--META-NETMembers 65 C LaCollanaLibriBianchiMETA-NET--TheMETA-NETWhitePaperSeries 69 1 SOMMARIO Nelcorsodegliultimi60anni,l’Europaèdiventatauna L’unica(impensabile)alternativaaquestotipodiEuro- struttura politica ed economica distinta, che si carat- pamultilinguesarebbequelladipermettereaunasingo- terizza per la ricchezza e la varietà del suo patrimonio lalinguadiacquisireunaposizionedominanteefinire culturaleelinguistico.Ciòsignificachedalportoghese persostituiretuttelealtrelingue. alpolaccoedall’italianoall’islandese,lacomunicazione quotidianatracittadinieuropei,cosìcomelacomunica- Letecnologiedellinguaggiocostruisconoponti zionenellasferadegliaffariedellapolitica,sonoinevita- perilfuturodell’Europa. bilmenteostacolatedabarrierelinguistiche.Leistituzio- nidell’UEspendonocircaunmiliardodieurol’annoper mantenerelaloropoliticadimultilinguismo,checonsi- Ilmodopiùnaturalepersuperarelebarrierelinguistiche stenellatraduzioneditestiscrittienell’interpretariato sarebbecertamentequellodiimpararelelinguestranie- dicomunicazioniorali.Secondoalcunestime,ilmerca- re.Eppure,considerandolaquantitàdellelingued’Eu- to europeo per la traduzione, l’interpretariato, la loca- ropa–circaottanta,tralingueufficialienon–l’appren- lizzazionedelsowareelaglobalizzazionedeisitiwebsi dimentodellelinguenonbastadasoloperlenecessità aggiraintornoa8.4miliardidieuroecisiaspettacheau- dellacomunicazione,delcommercioedeltrasferimen- mentidel10%all’anno.Masitrattadiunaspesadavve- todell’informazionetratuttiiconfinilinguistici.Senza ronecessaria?Nonostantequestoimpegnoeconomico, ilsupportodellatecnologia,peresempiolatraduzione i testi tradotti rappresentano solo una parte dell’infor- automatica,ladiversitàlinguisticadell’Europarischiadi mazioneadisposizionedellapopolazioneinpaesidove rappresentareunostacoloinsormontabilepericittadini c’èunasolalinguapredominante,comegliStatiUniti,la europeieperl’economia,ildibattitopoliticoeilprogres- CinaoilGiappone.Lemodernetecnologiedellinguag- soscientifico. gio e la ricerca linguistica possono dare un contributo Letecnologiedellinguaggiohannounruolochiaveper significativoperabbatterequesticonfinilinguistici.Se fornire una soluzione sostenibile, economica e social- combinatecondispositivieapplicazioniintelligenti,le mentevantaggiosaalproblemacreatodallebarrierelin- tecnologiedellinguaggioinfuturosarannoingradodi guistiche. aiutareicittadinieuropeiacomunicareefareaffarifacil- uestetecnologieoffrirannoagliattorieuropeienormi mentetraloroanchesenonparlanounalinguacomune. vantaggi, non solo all’interno del mercato comune eu- ropeo,maanchenellerelazionicommercialiconipae- L’economia italiana trae vantaggio dal mercato unico si terzi, in particolare le economie emergenti. Le solu- europeomalebarrierelinguistichepossonoportaread zionipropostedalletecnologiedellinguaggiofiniranno unalimitazionedegliscambi,soprattuttoperlePMIche perrappresentareununicopontetralelingued’Europa. nonhannoimezzifinanziariperinvertirelasituazione. Perraggiungerequestoobiettivoepreservareladiversità 1 culturaleelinguisticadell’Europa,èprimanecessarioef- taticonsiderevoli,mafuoridaiconfinieuropei.Ivinci- fettuareun’analisisistematicadelleparticolaritàlingui- toridiquestosviluppogeneralesonoGoogleeApple.In stichedituttelelingueeuropeeedellostatoattualedelle realtà,moltideisoggettiprincipalinelsettoreoggisono tecnologielinguisticheperciascunadiesse. aziendeprivateascopodilucroconsedenelNordAme- GiàallafinedeglianniSettantal’UEavevacompresola rica. grande importanza della tecnologia del linguaggio per Lamaggiorpartedeisistemiditecnologiadellinguaggio guidare l’unità europea, quando cominciò a finanziare sviluppatidaquesteaziendesibasanosuapproccistati- i primi progetti di ricerca(per esempio, EUROTRA). sticiimprecisi,chenonfannousodimetodilinguistici Dopounlungoperiodoincuiifinanziamentivenivano piùsofisticati.Peresempio,lefrasivengonotradotteau- concessiinmodorelativamentepococoncertato,pochi tomaticamente mettendo a confronto una nuova frase annifalaCommissioneEuropeahaistituitoundiparti- contromigliaiadifrasitradotteinprecedenzadaesse- mentodedicatoalletecnologiedellinguaggioeallatra- riumani.Laqualitàdelrisultatodipendeinlargamisu- duzioneautomatica. ra dalla dimensione e dalla qualità del corpus campio- Almomentol’UnioneEuropeasostieneprogetticome nedisponibile.Mentrelatraduzioneautomaticadifra- EuroMatrixeEuroMatrixPlus(dal2006)eiTranslate4 sisempliciinlingueconsufficientiquantitàdimateria- (dal2010),checonduconoricercadibaseeapplicatae le testuale a disposizione può raggiungere risultati uti- produconorisorseperlacreazioneditecnologielingui- li,dettimetodistatisticipocoprofondisonodestinatia stiche di alta qualità per tutte le lingue europee. ue- fallirenelcasodilinguechedispongonodimoltomeno stisforzihannogiàportatouncertonumerodirisulta- materialecampione,oppurenelcasodifrasiconstruttu- tinotevoli.Iserviziditraduzionedell’UnioneEuropea, recomplesse.Analizzareleproprietàstrutturalipiùpro- peresempio,attualmenteutilizzanoilsowareditradu- fondedellelingueèl’unicastradapercorribilesevoglia- zioneautomaticaopen-sourceMOSES,cheèstatosvi- mocreareapplicazionichefunzioninobenepertuttele luppatoprincipalmenteattraversoprogettidiricercaeu- lingued’Europa. ropei.Tuttavia,questiprogettinonsonomaisfociatiin unosforzocoerenteecoesoalivelloeuropeo,cheveda Letecnologielinguistiche l’UEeisuoistatimembriperseguireinmodosistemati- aiutanoaunificarel’Europa. coloscopocomunedisosteneretecnologicamentetutte lelingueeuropee. InEuropacisonocondizioniottimaliperlaricerca:gra- zieadiniziativecomeCLARIN,META-NETeFLaRe- Letecnologiedellinguaggio Net,lacomunitàdiricercaèbencoesa;inFLaReNete sonolachiaveperilfuturo. META-NETsonostatesviluppatedelleagendediricer- caalungotermine,eletecnologiedellinguaggiostanno Invecediinvestiresuirisultatideisuoiprogettidiricer- rafforzandoillororuolopressolaCommissioneEuro- ca,l’Europahamantenutolatendenzaasvolgereattività peainmodolentomacostante.Tuttavia,daalcunipunti diricercaisolate,conunimpattosulmercatomenoper- divista,lasituazioneeuropeaèpeggiorerispettoaquella vasivo.Diconseguenza,questapurintensaattivitàdifi- dialtresocietàmultilingui.Afrontedirisorsefinanzia- nanziamentononhaprodottodeirisultatisostenibili. rieinferiori,paesicomel’India,con22lingueufficiali,e Inmolticasi,laricercafattainEuropahaprodottorisul- ilSudAfrica,con11lingueufficiali,hannorecentemen- 2 teistituitoprogramminazionalialungotermineperla vitalitàculturalediquellalingua.E,d’altraparte,appli- ricercalinguisticaelosviluppotecnologico. cazionieservizisuInternetsonosostenibilisoloinpre- uellochemancainEuropasonolaconsapevolezza,la senza di adeguate infrastrutture e tecnologie. La ricer- volontàpoliticaeilcoraggiodilottareperunaposizio- canelcampodelletecnologiedellinguaggioècondotta nedileaderinternazionaleinquestosettoretecnologico inItaliainoltre15laboratori(secondoquantoriporta- attraversounosforzoconcertatodifinanziamento.Sulla todallostudioEUROMAP)elapresenzaitaliananella basedeirisultatiottenutifinora,sembrachelatecnolo- comunità di ricerca internazionale è attiva e rilevante. gialinguisticadioggi,definitaibridainquantocombina Apartiredal1997èstatofattounosforzoconsiderevo- imetodistatisticiconun’analisilinguisticaalivellopiù leinItalianellaricercasulletecnologiedellinguaggio, profondo,riusciràacolmareildivariotratuttelelingue quandoperquestosettoreèstatadesignataunapolitica europee. diricercanazionale.Sfortunatamente,ifiananziamenti ComevienemostratoinquestacollanadiLibriBianchi, alivellonazionalesonomoltolimitati,elostatoattuale c’èunanotevoledifferenzatraidiversipaesimembrire- delletecnologiedellinguaggiononèsufficienteagaran- lativamenteallostatodipreparazionerispettoallesolu- tire all’italiano una dimensione digitale proporzionata zionitecnologichelinguisticheeallostatodellaricerca. allarichiestadelleapplicazioniedeiservizidell’Internet L’italiano,inquantounadellegrandilinguedell’UE,si del futuro. Per i prossimi decenni la comunità italiana trovainunasituazionemiglioresiaperquantoriguar- devefareunosforzosostanzialepercrearerisorseestru- dalamaturitàdellaricercacheillivellodisviluppodelle mentilinguisticiperl’italianoingradoditrainarelari- tecnologielinguistiche.Tuttavia,l’italianonecessitaan- cerca,l’innovazioneelosviluppoingenerale.Inquesto coradiulterioriricercheprimadipoteraveresoluzioni volumeverràpresentataunaintroduzionealletecnolo- tecnologicheveramenteefficacipronteperl’usoquoti- gielinguisticheeallerelativeprinicipaliareediapplica- diano. zione, corredata da una valutazione dello stato attuale La percentuale di utenti Internet che parlano italiano delletecnologielinguistichedisponibiliperl’italiano. subirà una diminuzione nel prossimo futuro e l’italia- uesta collana di Libri Bianchi integra le altre azio- nopotrebbeandareincontroalproblemadiesseresotto ni strategiche intraprese da META-NET (si veda l’ap- rappresentatonelWeb,specialmenteseparagonatoal- pendice per una panoramica). Informazioni aggiorna- l’inglese.Èquicheletecnologiedellinguaggiopossono te, come per esempio la versione attuale del vision pa- svolgereunruolofondamentalepervincerelesfideche perdiMETA-NET[2]ol’AgendadiRicercaStrategi- aspettanolalinguaitaliananell’eradigitale.Lapresenza ca(SRA)sonodisponibilisulsitowebdiMETA-NET: “digitale”diunalinguainapplicazionieservizibasatisu http://www.meta-net.eu. Internetèormaiunelementocrucialepermantenerela 3

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.