ebook img

The Hungarian Language in the Digital Age / A magyar nyelv a digitális korban PDF

82 Pages·0.858 MB·
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview The Hungarian Language in the Digital Age / A magyar nyelv a digitális korban

WhitePaperSeries Fehérkönyveksorozat THE A MAGYAR HUNGARIAN NYELV A LANGUAGE IN DIGITÁLIS THE DIGITAL KORBAN AGE Simon Eszter Lendvai Piroska Németh Géza Olaszy Gábor Vicsi Klára WhitePaperSeries Fehérkönyveksorozat THE A MAGYAR HUNGARIAN NYELV A LANGUAGE IN DIGITÁLIS THE DIGITAL KORBAN AGE Simon Eszter MTANyelvtudományiIntézet Lendvai Piroska MTANyelvtudományiIntézet Németh Géza BME Olaszy Gábor BME Vicsi Klára BME GeorgRehm,HansUszkoreit (szerkesztők,editors) ELŐSZÓ PREFACE Ez a fehér könyv egy sorozat részét képezi, amelynek iswhitepaperispartofaseriesthatpromotesknow- célja, hogy felhívja a figyelmet a nyelvtechnológiára ledgeaboutlanguagetechnologyanditspotential. It ésazabbanrejlőlehetőségekre. Elsősorbanoktatókat, addresses journalists, politicians, language communi- újságírókat,politikusokatésnyelviközösségeketszólít ties, educators and others. e availability and use meg. Az európai nyelvek nyelvtechnológiai feldol- oflanguagetechnologyinEuropevariesbetweenlan- gozottsága és a nyelvtechnológia elterjedtsége megle- guages. Consequently,theactionsthatarerequiredto hetősen eltérő. Ezért a nyelvtechnológia fejlődéséhez furthersupportresearchanddevelopmentoflanguage és a kutatás elősegítéséhez szükséges lépések is nyel- technologiesalsodiffer. erequiredactionsdepend venkéntmásokésmások,ésolyankülönféletényezőkön onmanyfactors,suchasthecomplexityofagivenlan- múlnak,mintazadottnyelvösszetettsége,vagyanyel- guageandthesizeofitscommunity. vethasználóközösségnagysága. META-NET,aNetworkofExcellencefundedbythe A META-NET, az Európai Bizottság által alapított European Commission, has conducted an analysis of hálózat felmérést végzett a rendelkezésre álló nyelvi current language resources and technologies in this erőforrásokról és technológiákról (lásd a 73. oldalt). whitepaperseries(p.73). eanalysisfocusedonthe Ezafelmérésa23hivataloseurópainyelvmellettegyéb 23officialEuropeanlanguagesaswellasotherimpor- nemzeti és regionális nyelvekre is kiterjed, és ered- tantnationalandregionallanguagesinEurope.ere- ményei rámutatnak az egyes nyelvek terén fellelhető sultsofthisanalysissuggestthattherearetremendous kutatásihiányosságokra. Egy,ajelenlegihelyzetetbe- deficitsintechnologysupportandsignificantresearch mutatórészletesszakértőielemzésésértékeléssegíthet gapsforeachlanguage.egivendetailedexpertanal- atovábbikutatásokhatásánakmaximalizálásában. ysis and assessment of the current situation will help A META-NET 33 ország 54 kutatóközpontjából áll maximisetheimpactofadditionalresearch. (2011. novemberi helyzet szerint, lásd a 69. oldalt), As of November 2011, META-NET consists of 54 akikaterülettelfoglalkozóvállalkozásokkal,kormány- research centres from 33 European countries (p. 69). zatiszervekkel,kutatószervezetekkel,szovercégekkel, META-NETisworkingwithstakeholdersfromecon- szolgáltatókkal és európai egyetemekkel dolgoznak omy(sowarecompanies,technologyproviders,users), együtt. Egységestechnológiaivíziótalkotvaegyolyan government agencies, research organisations, non- stratégiaikutatásitervlétrehozásándolgoznak,amely- governmental organisations, language communities benmegfogalmazzák,hogyantudnakanyelvtechnoló- andEuropeanuniversities. Togetherwiththesecom- giaialkalmazásokakutatásihiányosságokonenyhíteni munities,META-NETiscreatingacommontechnol- a2020-igterjedőidőszakban. ogyvisionandstrategicresearchagendaformultilin- gualEurope2020. III META-NET–offi[email protected]–http://www.meta-net.eu Adokumentumszerzőiköszönetteltartoznakanémetfehér e authors of this document are grateful to the authors of könyvszerzőinekazért,hogyengedélyeztékanémetváltozat thewhitepaperonGermanforpermissiontore-useselected egyesnyelvfüggetlenrészeinekújrafelhasználását[1]. language-independentmaterialsfromtheirdocument[1]. AfehérkönyvmegírásátazEurópaiBizottság7. keretprog- edevelopmentofthiswhitepaperhasbeenfundedbythe ramja és ICT PSP programja támogatta a T4ME (szerző- SeventhFrameworkProgrammeandtheICTPolicySupport désszám: 249119), a CESAR (szerződésszám: 271022), ProgrammeoftheEuropeanCommissionunderthecontracts a METANET4U (szerződésszám: 270893) és a META- T4ME (Grant Agreement 249119), CESAR (Grant Agree- NORD(szerződésszám:270899)projektekenkeresztül. ment 271022), METANET4U (Grant Agreement 270893) andMETA-NORD(GrantAgreement270899). IV TARTALOMJEGYZÉK TABLE OF CONTENTS A MAGYAR NYELV A DIGITÁLIS KORBAN 1 Vezetőiösszefoglaló 1 2 Veszélybenanyelveink: Kihívásanyelvtechnológiának 4 2.1 Azeurópaiinformációstársadalomgátjai: anyelvihatárok . . . . . . . . . . . . . . . . . . . . . 5 2.2 Veszélybenanyelveink . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.3 Nyelvtechnológia: egykulcsfontosságútechnológia . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.4 Anyelvtechnológialehetőségei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.5 Anyelvtechnológiakihívásai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.6 Emberiésgépinyelvelsajátítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 3 Amagyarnyelvazeurópaiinformációstársadalomban 10 3.1 Általánostények . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.2 Amagyarnyelvkülönlegességei . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 3.3 Modernkorifejlődés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.4 NyelvművelésMagyarországon . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3.5 Amagyarnyelvazoktatásban . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.6 Nemzetközivonatkozások . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3.7 Amagyarnyelvazinterneten . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 4 Nyelvtechnológiamagyarul 15 4.1 Anyelvtechnológiaialkalmazásokfelépítése . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 4.2 Afőalkalmazásiterületek. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 4.3 Továbbialkalmazásiterületek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 4.4 Nyelvtechnológiaazoktatásban . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 4.5 Hazaiprojektek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.6 Azeszközökéserőforrásokelérhetősége . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.7 Nyelvekközöttiösszehasonlítás . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28 4.8 Összegzés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 5 AMETA-NET-ről 34 THE HUNGARIAN LANGUAGE IN THE DIGITAL AGE 1 ExecutiveSummary 35 2 LanguagesatRisk: aChallengeforLanguageTechnology 38 2.1 LanguageBordersHoldbacktheEuropeanInformationSociety . . . . . . . . . . . . . . . . . . 39 2.2 OurLanguagesatRisk . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39 2.3 LanguageTechnologyisaKeyEnablingTechnology . . . . . . . . . . . . . . . . . . . . . . . . 40 2.4 OpportunitiesforLanguageTechnology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.5 ChallengesFacingLanguageTechnology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 2.6 LanguageAcquisitioninHumansandMachines . . . . . . . . . . . . . . . . . . . . . . . . . . . 41 3 TheHungarianLanguageintheEuropeanInformationSociety 43 3.1 GeneralFacts . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.2 ParticularitiesoftheHungarianLanguage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 3.3 RecentDevelopments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.4 OfficialLanguageProtectioninHungary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.5 LanguageinEducation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.6 InternationalAspects . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.7 HungarianontheInternet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4 LanguageTechnologySupportforHungarian 48 4.1 ApplicationArchitectures . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 4.2 CoreApplicationAreas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49 4.3 OtherApplicationAreas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57 4.4 EducationalProgrammes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 4.5 NationalProjectsandInitiatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 4.6 AvailabilityofToolsandResources . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.7 Cross-languagecomparison . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 4.8 Conclusions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 5 AboutMETA-NET 66 A Hivatkozások--References 67 B META-NETtagok--META-NETMembers 69 C AMETA-NETfehérkönyveksorozat--TheMETA-NETWhitePaperSeries 73 1 VEZETŐI ÖSSZEFOGLALÓ Az információs technológia jelentősen megváltoz- Becslések szerint a magyar nyelvet összesen 13 mil- tatta mindennapi életünket. Jellemzően számítógépet lióanbeszélik,ezzela12.helyenállalegtöbbbeszélővel használunkírásra,szerkesztésre,számolásraésinformá- rendelkező nyelvek listáján Európában. A Magyar ciókeresésre, továbbá egyre inkább olvasásra, zenehall- Köztársaságállamnyelve,ahola10millióslakosságnak gatásra, fotó- és filmnézésre. Kis számítógépeket hor- kb.97%-amagyaranyanyelvű.Aszomszédoshétország- dunk a zsebünkben, és használjuk őket telefonálásra, ban is találunk magyar nyelvű közösségeket, amelyek e-mailírásra, információszerzésre és szórakozásra, közül a legnagyobb a romániai, megközelítőleg másfél bármerre is járunk. Milyen hatással van az informá- milliónyelvhasználóval.Ezenfelülemigránsközösségek ciónak,atudásnakésamindennapikommunikációnak használjákvilágszerte,elsősorbanazAmerikaiEgyesült ezamasszívdigitalizálódásaanyelvünkre?Megváltozik Államokban,KanadábanésIzraelben. anyelvünk,vagyeltűnik? Számítógépeinkegynagyés A magyar nyelv szigetet alkot Európában, ugyanis a erőteljesglobálishálózatrészeitképezik. AlányIpane- legtöbbeurópainyelvazindoeurópainyelvcsaládbatar- mában,ahivatalnokBudapestenésamérnökDelhiben tozik, de a magyar nem. A magyar finnugor nyelv, ugyanúgy tudnak csetelni a barátaikkal a Facebookon, rokonai a finn, az észt és néhány más, Oroszország- denemvalószínű,hogyvalahaistalálkoznakegymással ban élő népek által beszélt nyelv. A magyar nyelv a onlineközösségekbenvagyfórumokon.Haazonaggód- legtöbb beszélővel rendelkező nem indoeurópai nyelv nak,hogyhogylehetkezelniafülfájást,akkormindan- Európában,de–ellentétbenolyanvilágnyelvekkel,mint nyianaWikipédiátfogjákmegnézni,denemugyanazt azangolvagyakínai,ésazolyangyakranhasználteuró- a cikket fogják olvasni. Amikor európai netezők a painyelvekkel,mintanémetvagyafrancia–amagyar fukushimai atomkatasztrófának az európai energetikai nemjátszikprominensszerepetnemzetköziszinten. piacra gyakorolt hatásairól beszélgetnek a fórumokon, Sokan panaszkodnak Magyarországon az anglicizmu- akkoreztjellemzőennyelvilegszeparáltközösségekben sok egyre erősödő használata miatt, és attól tartanak, teszik.Amitazinternetösszeköt,aztahasználóknyelvi hogyamagyarnyelvetelárasztjákazangolszavakéskife- korlátai még mindig szétválasztják. Ez vajon mindig jezések. Ezamegközelítésfélrevezető. Amagyarnyelv így lesz? A világ 6000 nyelve közül sok nem fog élet- már túlélte az új szavak hatását, melyeket különböző ben maradni egy globalizált digitális információs tár- töröknyelvekbőlvettünkátahonfoglaláselőttikorban, sadalomban. Becslésekszerintlegalább2000nyelvki- és túlélte az erős szláv hatást is a Kárpát-medencében. halásra van ítélve a következő évszázadokban. Mások KésőbbazOszmánBirodalomrészevoltazország150 szerepetfognakugyanjátszaniacsaládiésismerősikör- évig,majdaHabsburgBirodalomidejealattalatinésa ben,deaszélesebbüzletiéstudományosszférábannem. németnyelvhatásavoltnagyonerős.Kedveskismagyar Milyenekamagyarnyelvesélyeiatúlélésre? szavaink elvesztésének egy jó ellenszere, ha használjuk 1 őket – gyakran és tudatosan. Nyelvészeti polémiák az generációba olyan szoverek fognak tartozni, amelyek idegen befolyásról és kormányzati rendelkezések nem nemcsakakiejtetthangokatvagyaleírtbetűket,hanem segítenek. Nem a nyelvünk fokozatos anglicizálódása aszavakatésamondatokatisértik,ésafelhasználókat miattkelleneaggódnunk,inkábbamiatt,hogynyelvünk jobban támogatják azáltal, hogy beszélik és értik a a személyes élet főbb területeiről eltűnhet. Nem a tu- nyelvüket. Ezeknek a fejlesztéseknek az előfutárai az dományra,alégiirányításravagyaglobálisüzletipiacra olyan szabadon elérhető online szolgáltatások, mint a gondolunk,hanemazéletolyanterületeire,aholsokkal GoogleTranslate,amely57nyelvközöttfordít,vagyeu- fontosabb,hogyanyelvközelálljonazországlakóihoz, rópaiversenytársa,azitranslate4.eu(egyMagyarország mintnemzetközipartnerekhez, ilyenekpéldáulahelyi által vezetett konzorcium terméke), továbbá az IBM szokások,azügyintézés,atörvényalkotás,akultúraésa szuperszámítógépe,Watson,amelymegverteaJeopardy vásárlás. nevű játék amerikai bajnokát, és az Apple mobilalkal- mazása,aSiri,amelyreagálahangvezérlésre,ésválaszol Egynyelvstátuszanemcsakbeszélőinekszámátólfügg, angol,német,franciaésjapánnyelven. hanem attól is, hogy mennyire van jelen az informá- ciós térben és a szoveralkalmazásokban. Egy megle- Az információs technológia következő generációja hetősenaktívmagyarnyelvűwebesközösséglétezéséről olyan szintű nyelvi képességgel fog rendelkezni, hogy tanúskodik az, hogy a magyar Wikipédia a 19. legna- az emberi felhasználók saját nyelvükön tudnak majd gyobb,megelőzveolyantöbbbeszélővelrendelkezőeu- kommunikálni ezt a technológiát használva. Az esz- rópai nyelveket, mint a török, a román vagy a dán, közök képesek lesznek automatikusan megtalálni a és olyan világnyelveket, mint az arab vagy a koreai. legfontosabb híreket és információkat a világ digi- Néhányfontosnemzetköziszovermagyarváltozatban tális tudásbázisából – mindezt könnyen használható is elérhető, azonban a magyar nyelv specialitása meg- hangvezérléssel. Anyelvtechnológiaképesleszautoma- nehezíti az angolalapú alkalmazások adaptálását. A tikusanfordítani, vagysegíteniatolmácsokmunkáját; költséges magyar nyelvű technológiák fejlesztését az is beszélgetéseket és dokumentumokat összefoglalni; és hátráltatja,hogyamagyarpiacmeglehetősenkicsi. támogatniafelhasználókatatanulásban. Amianyelvtechnológiátilleti,amagyarországihelyzet Az információs és kommunikációs technológia óvatos optimizmusra ad okot. Nagyrészt állami, következőgenerációjaelériaziparirobotokatis(jelenleg az utóbbi időben európai támogatással, de létezik fejlesztésalattállakutatólaboratóriumokban),melynek nyelvtechnológiaikutatásMagyarországon. Ajelenleg következményeképpenértenifogják,hogyafelhasználó futó két európai, Magyarország által koordinált ICT mitakar,ésmégbeisszámolnakazeredményekről. projektközülmindkettőnyelvtechnológiaitémájú.Szá- mostechnológiaéserőforrásállrendelkezésreamagyar Ateljesítménynekeza szintjeaztjelenti, hogytúlkell nyelvre, bár közel sem annyi, mint az angolra, és ezek lépni az egyszerű karakterhalmazokon, szótárakon, nemelégségesekegyvalóditöbbnyelvűtudásalapútár- helyesírás-ellenőrzőkön és kiejtési szabályokon. A sadalomigényeinekkielégítésére. technológiának meg kell haladnia az egyszerűsítő Az információs és kommunikációs technológia megközelítéseket, és el kell kezdenie olyan nyelvmo- már a következő forradalomra készül. A személyi delleket gyártani, amelyek figyelembe veszik a szin- számítógépek, hálózatok, miniatürizáció, multimédia, taxissalegyüttaszemantikátisahhoz,hogymegértsék mobileszközökésacloudtechnológiautánakövetkező akérdéseksorát,ésrelevánsválaszokatadjanakrájuk. 2

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.