ebook img

The Finnish Language in the Digital Age PDF

82 Pages·2012·1.679 MB·
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview The Finnish Language in the Digital Age

WhitePaperSeries Valkoisetkirjat THE FINNISH SUOMEN KIELI LANGUAGE IN DIGITAALISELLA THE DIGITAL AIKAKAUDELLA AGE Kimmo Koskenniemi Helsinginyliopisto Krister Lindén Helsinginyliopisto Lauri Carlson Helsinginyliopisto Martti Vainio Helsinginyliopisto Antti Arppe Helsinginyliopisto Mietta Lennes Helsinginyliopisto Hanna Westerlund Helsinginyliopisto Mirka Hyvärinen Helsinginyliopisto Imre Bartis Helsinginyliopisto Pirkko Nuolijärvi KOTUS Aino Piehl KOTUS GeorgRehm,HansUszkoreit (toimittajat,editors) Editors Georg Rehm HansUszkoreit DFKI DFKI Alt-Moabit 91c Alt-Moabit 91c Berlin 10559 Berlin 10559 Germany Germany e-mail: [email protected] e-mail: [email protected] ISSN 2194-1416 ISSN 2194-1424 (electronic) ISBN 978-3-642-27247-9 ISBN 978-3-642-27248-6 (eBook) DOI 10.1007/978-3-642-27248-6 Springer Heidelberg NewYork Dordrecht London LibraryofCongressControlNumber:2012940571 (cid:2)Springer-VerlagBerlinHeidelberg2012 Thisworkissubjecttocopyright.AllrightsarereservedbythePublisher,whetherthewholeorpartofthematerialis concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation, broadcasting, reproduction on microfilms or in any other physical way, and transmission or information storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology now known or hereafter developed.Exemptedfromthislegalreservationarebriefexcerptsinconnectionwithreviewsorscholarlyanalysis ormaterialsuppliedspecificallyforthepurposeofbeingenteredandexecutedonacomputersystem,forexclusive use by the purchaser of the work. Duplication of this publication or parts thereof is permitted only under the provisions of the Copyright Law of the Publisher’s location, in its current version, and permission for use must always be obtained from Springer. Permissions for use may be obtained through RightsLink at the Copyright ClearanceCenter.ViolationsareliabletoprosecutionundertherespectiveCopyrightLaw. Theuseofgeneraldescriptivenames,registerednames,trademarks,servicemarks,etc.inthispublicationdoesnot imply,evenintheabsenceofaspecificstatement,thatsuchnamesareexemptfromtherelevantprotectivelawsand regulationsandthereforefreeforgeneraluse. Whiletheadviceandinformationinthisbookarebelievedtobetrueandaccurateatthedateofpublication,neither theauthorsnortheeditorsnorthepublishercanacceptanylegalresponsibilityforanyerrorsoromissionsthatmay bemade.Thepublishermakesnowarranty,expressorimplied,withrespecttothematerialcontainedherein. Printedonacid-freepaper SpringerispartofSpringerScience+BusinessMedia(www.springer.com) ESIPUHE PREFACE META-NETValkoisetkirjat-julkaisusarjantavoittee- is white paper is part of a series that promotes na on edistää tietämystä kieliteknologiasta ja sen tar- knowledgeaboutlanguagetechnologyanditspoten- joamista mahdollisuuksista. Tämä julkaisu haluaa he- tial.Itaddressesjournalists,politicians,languagecom- rättääopettajia,toimittajia,poliitikkoja,kieliyhteisöjä munities, educators and others. e availability and jamuitakin. use of language technology in Europe varies between Euroopankieltenkieliteknologistensovellustensaata- languages.Consequently,theactionsthatarerequired vuusvaihtelee.Niinpämyöstoimenpiteet,joitajatkos- to further support research and development of lan- satarvitaantukemaankieliteknologioidentutkimusta guage technologies also differ. e required actions jakehitystä,ovaterikieltenkohdallaerilaisiajariippu- depend on many factors, such as the complexity of a vatkielenominaispiirteistäjakieliyhteisönkoosta. givenlanguageandthesizeofitscommunity. EuroopankomissionrahoittamanMETA-NET-huip- META-NET,aNetworkofExcellencefundedbythe puosaamisverkoston kartoitustyö tässä valkoistenkir- European Commission, has conducted an analysis of jojensarjassa(p.81)kattaaEuroopan23virallisenkie- current language resources and technologies in this len sekä tärkeiden kansallisten ja paikallisten kielten whitepaperseries(p.81). eanalysisfocusesonthe kieliaineistot ja kieliteknologiat. Tulosten perusteella 23officialEuropeanlanguagesaswellasotherimpor- kaikkienkartoitettujenkieltentutkimuskärsiimerkit- tantnationalandregionallanguagesinEurope.ere- tävästäresurssienpuutteesta.Yksityiskohtaisempiny- sultsofthisanalysissuggestthattherearetremendous kyisentilanteenselvitysvahvistaatulevantutkimuksen deficitsintechnologysupportandsignificantresearch vaikutustajavähentääriskejä. gapsforeachlanguage.egivendetailedexpertanal- META-NET koostuu 33 valtion 54 tutkimuskeskuk- ysis and assessment of the current situation will help sesta[1](s.77),jotkatekevätyhteistyötäuseidentoi- maximisetheimpactoffutureresearch. mijoiden ja intressiryhmien kanssa. Mukana on lii- META-NETconsistsof54researchcentresin33Eu- keyrityksiä, julkisenhallinnonyksiköitä,teollisuuden ropeancountries[1](p.77). META-NETisworking edustajia, tutkimusyksiköitä, tietotekniikan alan yri- withstakeholdersfromeconomy(sowarecompanies, tyksiä,teknologiantuottajiajaeurooppalaisiayliopis- technologyprovidersandusers),governmentagencies, toja.Työntuloksenaonsyntymässäteknologinenvisio research organisations, non-governmental organisa- osanastrategistatutkimuslinjaustaosoittamaan,miten tions, language communities and European universi- kieliteknologiat auttavat Euroopan tutkimusyhteisöä ties. Together with these communities, META-NET ratkaisemaan keskeisiä tutkimuskysymyksiä vuoteen iscreatingacommontechnologyvisionandstrategic 2020mennessä. researchagendaformultilingualEurope2020. III META-NET–offi[email protected]–http://www.meta-net.eu TämänraportintekijätovatkiitollisiasaksankielisenMETA- e authors of this document are grateful to the authors of NETvalkoisenkirjantekijöilleluvastakäyttääraporttinsakie- theWhitePaperonGermanforpermissiontore-useselected lestäriippumattomienosioidentekstejäosanatämänraportin language-independentmaterialsfromtheirdocument[2]. englanninkielistäosuuttasekälähteenäsuomenkielisellekään- nökselle[2]. edevelopmentofthiswhitepaperhasbeenfundedbythe SeventhFrameworkProgrammeandtheICTPolicySupport Tämän valkoisen kirjan tuottamiseen on myönnetty rahoi- ProgrammeoftheEuropeanCommissionunderthecontracts tustaEuroopankomissionseitsemännestäpuiteohjelmastaja T4ME (Grant Agreement 249119), CESAR (Grant Agree- tieto-javiestintäteknologioidentukiohjelmastaseuraavienso- ment 271022), METANET4U (Grant Agreement 270893) pimustenperusteellaT4ME(rahoitussopimus249119),CE- andMETA-NORD(GrantAgreement270899). SAR(rahoitussopimus271022),METANET4U(rahoitusso- pimus270893)jaMETA-NORD(rahoitussopimus270899). IV SISÄLLYSLUETTELO TABLE OF CONTENTS SUOMEN KIELI DIGITAALISELLA AIKAKAUDELLA 1 Tiivistelmä 1 2 Uhkakansalliskielilleonhaastekieliteknologialle 4 2.1 KieltenvälisetrajatesteenäEuroopantietoyhteiskunnankehitykselle . . . . . . . . . . . . . . . . . 5 2.2 Kieletkohtaavatuusiauhkia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.3 Kieliteknologiatukeekieltensäilymistä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.4 Kieliteknologianmahdollisuuksia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.5 Kieliteknologianhaasteita. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.6 Kielenomaksumisesta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 SuomenkieliEuroopantietoyhteiskunnassa 10 3.1 Perustietoasuomenkielenasemastajakäytöstä . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.2 Suomenkielenerityispiirteitä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.3 Suomenkielenkehityksestä . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.4 Suomenkielenhuolto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3.5 Kielijaoppiminen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3.6 Kansainvälisiänäkökulmia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.7 SuomenkielijaInternet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4 Kieliteknologiansuomenkielentuki 17 4.1 Sovellusarkkitehtuurit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4.2 Keskeisetsovellusalat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18 4.3 Muutsovellusalat . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 4.4 KieliteknologianopetusSuomessa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.5 Kansallisethankkeet. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.6 Kieliteknologisettyökalutjakieliaineistot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.7 Kieltenvälistävertailua . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 4.8 Johtopäätökset . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 5 META-NET 35 THE FINNISH LANGUAGE IN THE DIGITAL AGE 1 ExecutiveSummary 37 2 RiskforOurLanguagesandaChallengeforLanguageTechnology 40 2.1 LanguageBordersHindertheEuropeanInformationSociety . . . . . . . . . . . . . . . . . . . . 41 2.2 OurLanguagesatRisk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.3 LanguageTechnologyisaKeyEnablingTechnology . . . . . . . . . . . . . . . . . . . . . . . . 42 2.4 OpportunitiesforLanguageTechnology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 2.5 ChallengesFacingLanguageTechnology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.6 LanguageAcquisitioninHumansandMachines . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3 FinnishintheEuropeanInformationSociety 46 3.1 GeneralFacts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.2 ParticularitiesoftheFinnishLanguage. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.3 RecentDevelopments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 3.4 LanguageCultivationinFinland. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.5 LanguageinEducation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.6 InternationalAspects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.7 FinnishontheInternet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51 4 LanguageTechnologySupportforFinnish 53 4.1 ApplicationArchitectures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53 4.2 CoreApplicationAreas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54 4.3 OtherApplicationAreas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 4.4 EducationalProgrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 4.5 NationalProjectsandEfforts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63 4.6 AvailabilityofToolsandResources . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 4.7 Cross-languagecomparison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 66 4.8 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67 5 AboutMETA-NET 71 A Viitteet--References 73 B META-NETJäsenet--META-NETMembers 77 C META-NETvalkoisetkirjat--TheMETA-NETWhitePaperSeries 81 1 TIIVISTELMÄ Tietotekniikka muuttaa jokapäiväistä elämäämme. tietoyhteiskunnassa.Arvioltavähintään2000kieltäon Käytämmetietokoneitakirjoittamiseen,tekstinmuok- tuomittusukupuuttoontulevinavuosikymmeninä.Joi- kaamiseen,laskemiseen,tiedonetsimiseenjayhäenem- takinkieliämahdollisestikäytetäänjatkossakinperheis- män myös lukemiseen, musiikin kuunteluun sekä va- säjakyläyhteisöissä,muttaeiyrityksissätaiakateemises- lokuvien ja elokuvien katseluun. Kannamme taskuis- samaailmassa.Minkälaisetsiisovatsuomenkielensel- samme pieniä tietokoneita, joilla soitamme puheluja, viytymismahdollisuudet? lähetämmesähköpostiajaviihdytämmeitseämmesiellä Suomeapuhuuyli5miljoonaaihmistä,jotenseonmo- missäkulloinkinsatummeolemaan.Kuinkatämävalta- niinmuihinkieliinverrattunakohtalaisenhyvässäase- vainformaation,tietämyksenjaarkisenviestinnändigi- massa. Suomenkielisiä julkisia televisiokanavia on nel- talisoituminen vaikuttaa kieleemme? Muuttuuko suo- jä ja yksityisiä yli 30. Useimmat kansainväliset eloku- menkielitaivoikosejopakadota?Kaikkitietokoneem- vattekstitetäänsuomeksi.Suomenkieliontodennäköi- me ovat yhteydessä toisiinsa entistä tiheämmän ja te- sestihiemanvahvistanutasemiaansenjälkeenkunSuo- hokkaamman maailmanlaajuisen verkon kautta. Tyttö miliittyiEU:ntäysjäseneksi.Kielenpuhujien,kirjojen, Ipanemassa,tullimiesImatrallajainsinööriKatmandus- elokuvienjatelevisiokanavienmääränlisäksitietynkie- sa voivat jutella ystäviensä kanssa Facebookissa, mutta len tilanne riippuu myös sen digitaalisesta läsnäolosta toisiinsa he tuskin koskaan verkossa törmäävät. Jos he tietoverkoissajasovellusohjelmissa.Tälläkinmittapuul- ovathuolissaankorvasärystä,hekäyvätlukemassaWi- la suomi sijoittuu kohtalaisen hyvin: kaikki keskeiset kipediasta kaiken mahdollisen tämän vaivan hoitoon kansainvälisetohjelmistotuotteetovatsaatavillasuoma- liittyvän, mutteivät silloinkaan lue samaa artikkelia. Ja laisina versioina, suomenkielisessä Wikipediassa on yli kun Euroopan nettikansalaiset keskustelevat Fukushi- 290000artikkeliajaverkkotunnus.fionhyvinsuosittu. man ydinonnettomuuden vaikutuksista eurooppalai- seenenergiapolitiikkaan,tapahtuuajatustenvaihtoerik- Kieliteknologianalallasuomenkielelleontarjollakoh- seenkunkinkieliyhteisönsisäisilläkeskustelupalstoilla. tuullinen määrä tuotteita, teknologioita ja kielivaroja. Kielet erottavat edelleenkin sen minkä Internet voisi Onolemassasuomenkielisiäsovelluksiajatyökalujapu- yhdistää. Tyydymmekö tähän tilanteeseen myös tule- hesynteesiä, puheentunnistusta, tiedonhakua sekä oi- vaisuudessa? keinkirjoituksenjakieliopintarkistustavarten.Onole- Tieteiselokuvissa kaikki puhuvat samaa kieltä. Voisiko massa myös joitakin automaattista kääntämistä varten tämä yhteinen kieli olla suomi, vaikka astronautit har- kehitettyjäsovelluksia,vaikkaneeivätuseintuotakaan voinlausuvatsuomalaisiasanojayhtäluonnollisestikuin kielellisestijaidiomaattisestioikeitakäännöksiävarsin- he puhuvat englantia? Monet maailman 6000 kielestä kaan kun suomi on kohdekielenä. Tähän ovat osittain eivättuleselviytymäänglobalisoituneessadigitaalisessa syynäsuomenkielenerityispiirteet. 1 Tieto- ja viestintätekniikka valmistautuvat nyt seuraa- kaitakysymyksiävoidaanymmärtääjaantaaniihinpe- vaan vallankumoukseen. Mikrotietokoneita, multime- rusteellisiajarelevanttejavastauksia. diaa,tietoverkkoja,laitteidenpienentymistä,multime- Englannin ja suomen välillä on kuitenkin ammotta- diaa,mobiililaitteitajapilvilaskentaaseuraavateknolo- vateknologinenkuilu,jokatätänykyävieläpälevenee. giansukupolviluoohjelmistoja,jotkaymmärtävätkir- 1980- ja 1990-luvun menestyksekkäiden tutkimussaa- jainten ja äänteiden lisäksi myös kokonaisia sanoja ja vutustenjälkeenSuomionnytmenettämässärooliaan lauseita.Tällaisetohjelmistotpalvelevatkäyttäjiäänen- kieliteknologianedistäjänä.Kieliteknologianperustut- tistä paremmin, koska ne puhuvat ja ymmärtävät hei- kimustarahoitettiintutkimuksenhuippuyksiköntasol- dänkieltään.Alanedelläkävijöitäovatilmainenonline- la1980-ja1990-luvuilla,mikäjohtiuseidenkehitettyi- palveluGoogleTranslate,jokakääntää57kielenvälillä, hintuotteisiinperustuvienyritystenperustamiseen. IBM:nsupertietokoneWatson,jokapäihittiJeopardy- Perustutkimuksenrahoituksenkaudenjälkeenteknolo- tietovisassaYhdysvaltojenmestarin,sekäAppleniPho- giateollisuuteenliittyväthankkeetovatsaaneetvainpie- neenkehittämäSiri-avustaja,jokareagoiäänikomentoi- nimuotoista rahoitusta Tekesiltä (teknologian ja inno- hinjavastaaenglanniksi,saksaksi,ranskaksijajapaniksi vaatioiden kehittämiskeskukselta). Tämän seurauksena esitettyihinkysymyksiin. Suomi(jakokoEurooppa)menettijoitakinerittäinlu- Tietotekniikan seuraava sukupolvi tulee hallitsemaan paavia huipputekniikan innovaatioita Yhdysvaltoihin, ihmiskielenniinlaajasti,ettäerikielisetkäyttäjätpysty- jossatutkimuksenstrateginensuunnitteluonpitkäjän- vätviestimäänkeskenäänkukinomallakielellään.Help- teisempää ja rahoitusta on paremmin saatavilla myös pokäyttöistenäänikomentojenpohjaltalaitteetosaavat uusien teknologioiden markkinoille tuomiseen. Vaik- hakeaautomaattisestitärkeimmätuutisetjamuutatie- kauraauurtavallatuoteideallaonnistuisikinsaamaanva- toa maailman digitaalisista tietovarannoista. Kielitek- raslähdönteknologisteninnovaatioidenkilpailussa,voi nologianavullavoidaantehdäautomaattisiakäännöksiä omanetulyöntiasemansavarmistaavainsiinätapaukses- jaavustaatulkkeja.Sitävoikäyttäätulevaisuudessamyös sa,ettäpystyymyösylittämäänmaaliviivan.Muutenkä- keskustelujenjaasiakirjojentiivistämiseensekäopiske- teenjääpelkkäkunniamainintaWikipediassa. luntukena.Kieliteknologiavoiesimerkiksiauttaamaa- Kunkieliteknologianperustutkimuksenrahoitusvähe- hanmuuttajiaoppimaansuomeajaintegroitumaanpa- ni, siirtyivät monet suomalaiset asiantuntijat erilaisiin remminsuomalaiseenkulttuuriin. pienyrityksiin. Yhdysvaltalaiset yritykset käyttivät re- Seuraavansukupolventieto-javiestintätekniikanavul- surssejaankehittääkseenteknologioistaitselleenkäyttö- la kehitellään jo nyt tutkimuslaboratorioissa teollisuu- kelpoisiatuotteita.TästähuolimattaSuomessaonedel- denjapalvelualanrobotteja,jotkasekäymmärtävättäy- leen hyvin suuri tutkimuspotentiaali. Kansainvälises- sinmitäkäyttäjätniiltähaluavatettäosaavatraportoida titunnettujentutkimuskeskustenjayliopistojenlisäksi omista saavutuksistaan. Tällaiseen suoritustasoon pää- täälläonmyösinnovatiivisiapieniäjakeskikokoisiakie- seminenvaatiipaljonenemmänkuinpelkkienmerkis- liteknologiayrityksiä,jotkapysyväthengissäsilkanluo- töjen,sanakirjojen,oikolukuohjelmienjaääntämissään- vuuden ja valtavien ponnistusten ansiosta, vaikka niil- töjenkäyttöä.Yksinkertaistettulähestymistapatekno- läeiolekaanriskipääomaataijatkuvaajulkistarahoitus- logiassaeienääriitä,vaanonryhdyttävämallintamaan ta.Suomenkielisenkieliteknologianvarhaisenkaupalli- kieltäkokonaisvaltaisesti.Onsamanaikaisestihuomioi- senmenestyksentakiaeitutkimusyhteisöenääpäässyt- tavasekäsyntaksiettäsemantiikka,jottamyösmutkik- käänkäyttämäänsuomenkielenkäsittelyynkehitettyjä 2 perustyökalujakutenjäsentimiäjasanastoja.Yllättävä- tenkin dramaattisestimuuttua, kun uusiteknologiasu- nä seurauksena tästä suomalaisissa tutkimusprojekteis- kupolvitodellaalkaaosataihmiskieliä.Konekääntämi- sa ei enää juuri käytetty nimenomaan suomen kielelle sen kehittyessä kielimuurien ylittäminen kylläkin hel- kehitettyäteknologiaa,vaanuseimmattutkimus-jake- pottuu, mutta vain sellaisten kielten välillä, jotka ovat hitystyöntuloksinasyntyneetprototyypitpohjautuivat selviytyneetdigitaalisessamaailmassa.Myöspienetkie- englannille. letselviytyvätvarmemmin,josniilleonsaatavillasopivia Riittävänkielivarojajaperustutkimustatukevanrahoi- kieliteknologisiavälineitä. tuksen puutteen vuoksi suomi on harvoin ollut edus- “Harjaavainniitähampaita,jotkahaluatpitää”,varoit- tettunakansainvälisissäteknologiakilpailuissa.Näinon taahammaslääkärileikkisästi.Varoituspäteemyöstut- käynyt esimerkiksi tiedonpoiminnan, kieliopin tarkis- kimuksen tukitoimiin. On kuitenkin muistettava, että tuksen, konekääntämisen ja monien muidenkin sovel- opiskellavoi mitäkieltätahansa,muttakallistatekno- lusalojenkohdalla. logiaakannattaakehittääainoastaanniitäkieliävarten, Monettutkijatarvelevatnäidenongelmienjohtuvansii- joidenhalutaansäilyvänelinvoimaisina. tä, että jo viidenkymmenen vuoden ajan sekä tietoko- META-NETinpitkäntähtäimentavoiteontuodakor- nelingvistiikan algoritmit ja menetelmät että kielitek- kealuokkaista kieliteknologiaa kaikkien kielten saata- nologisten sovellusten tutkimus ovat ensisijaisesti kes- ville, jotta poliittinen ja taloudellinen yhtenäisyys voi- kittyneet vain englannin kieleen. Vuosina 2008–2010 daan saavuttaa kulttuurinen monimuotoisuus säilyt- julkaistujen johtavien konferenssijulkaisujen ja tieteel- täen.Teknologiatuleeavustamaanolemassaolevienes- listenaikakauslehtienvalikoimassa971artikkelissakä- teiden poistamisessa ja yhteyksien rakentamisessa Eu- siteltiinenglanninkielistäkieliteknologiaajavainkym- roopan kielten välille. Tarvittava teknologinen kehitys menessäsuomenkielistä.Tanskajaruotsiolivatparem- edellyttää,ettäkaikkitoimijatpolitiikan,tutkimuksen min edustettuina: tanskankielisestä teknologiasta pu- kuin yhteiskunnan saralla yhdistävät voimansa tavoit- huttiin 26:ssa ja ruotsinkielisestä 19:ssä artikkelissa. teensaavuttamiseksi. Norjankielijäihännänhuipuksivainkahdellaartikke- Kieliteknologisissa hybridimalleissa kielen syväraken- lilla. teen prosessointi yhdistyy tilastollisiin malleihin. Us- On kuitenkin sellaisiakin tutkijoita, joiden mielestä komme niitä hyödyntävän modernin kieliteknologian englantiluonnostaansopiiparemmintietokoneellakä- mahdollisuuksiin rakentaa yhteyksiä Euroopan kielten siteltäväksi. Nykymenetelmillä myös espanjan ja rans- välille.TässäraportissakuvataanEuroopanjäsenvaltioi- kankaltaisetkieletovatpaljonhelpompiakäsitelläkuin den kieliteknologian tutkimuksen tilannetta ja kartoi- suomi. Tarvitsemme siis asialleen omistautuvaa, joh- tetaan käytettävissä olevien ratkaisujen valmiusastetta donmukaista ja pitkäjänteistä tutkimustyötä, jos ha- kussakinMETA-NETinjäsenmaassa. luamme hyödyntää tieto- ja viestintäteknologian seu- META-NET Valkoiset kirjat -julkaisusarja on hank- raavaasukupolveaniilläyksityis-jatyöelämämmealueil- keenkeskeisiätehtäviäjasetoimiipohjanastrategisille la, joilla nyt puhumme ja kirjoitamme suomea. Kai- toimenpide-ehdotuksille. META-NET julkaisee ajan- ken kaikkiaan voidaan todeta, että tuhon ennustajis- tasaista tietoa toiminnastaan, kuten visiopaperin [3] tajaenglanninkielisentietojenkäsittelynkyvykkyydestä ja strategisen tutkimussuunnitelman, verkkosivuillaan huolimattasuomenkielieiolevaarassa.Tilannevoikui- http://www.meta-net.eu. 3 2 UHKA KANSALLISKIELILLE ON HAASTE KIELITEKNOLOGIALLE Olemmetodistamassadigitaalistavallankumousta,jon- (cid:13) tekstin toimittamisen ja bibliografian laatimisen ka vaikutukset viestinnän toimivuuteen ja sitä kautta suositusten luominen takasi painotuotteiden laa- kokoyhteiskuntaantulevatolemaanmerkittäviä.Tieto- dun; ja viestintätekniikan viimeaikaista kehitystä on toisi- (cid:13) erilaisetviestintäkanavat,kutensanomalehti,radio, naan verrattu Gutenbergin keksimään kirjapainotek- televisio ja kirja, tyydyttivät erilaisia viestinnällisiä niikkaan.MillaisiaoletuksiaEuroopantietoyhteiskun- tarpeita. nanjaerityisestikieltemmetulevaisuudestavoimmever- tauksenpohjaltatehdä? Informaatioteknologia on kuluneiden kahdenkymme- nenvuodenaikanaauttanutautomatisoimaanasioitaja helpottanutmoniatoimintojammearjessa: Digitaalisenvallankumouksenvaikutukset yhteiskuntaantulevatolemaanmerkittäviä. (cid:13) tietokoneavusteinen julkaisuohjelma on korvannut kirjoituskoneenjaladonnan; Gutenberginkeksinnöstäseurasitodellisialäpimurtoja (cid:13) piirtoheitinkalvot tehdään nykyisin esitysmateriaa- viestinnässäjatiedonsiirrossa,kutenLutherinRaama- lien tuottamista varten tehdyillä ohjelmilla, kuten tun käännös kansankielelle. Gutenbergin ajan jälkeen OpenOfficen esitysgrafiikat tai Microso Power- kuluneinavuosisatoinaonkehitettyerikulttuurientar- Point; peisiin monenlaisia teknikoita parantamaan kielenkä- (cid:13) sähköposti lähettää ja vastaanottaa tiedostoja no- sittelyäjatietämyksensiirtoa: peamminkuinfaksi; (cid:13) suurten kielten ortografinen ja kieliopillinen stan- (cid:13) voimme puhua edullisia tai jopa ilmaisia Internet- dardisointimahdollisti puhelujajakokoontuavirtuaalisestiverkkokeskuste- luohjelmienavulla; (cid:13) uusientieteellistenjahenkistensaavutustennopean levittämisen; (cid:13) äänenjakuvantallennusformaatittekevätmultime- diasisällönjakamisenhelpoksi; (cid:13) virallisten kielten kehittyminen mahdollisti kansa- laisten kommunikoinnin tiettyjen (usein poliittis- (cid:13) hakukoneet tarjoavat asiasanaperusteista verkkosi- ten)rajojensisällä; vujenhakumahdollisuutta; (cid:13) kieltenopetusjakääntäminenmahdollistikieltenvä- (cid:13) verkossa olevat palvelut kuten Googlen Kääntäjä lisenviestinnän; tuottavatnopeita,summittaisiakäännöksiä; 4

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.