L2/15-090R 2015-06-02 Proposal to Encode the Masaram Gondi Script in Unicode AnshumanPandey DepartmentofLinguistics UniversityofCalifornia,Berkeley Berkeley,California,U.S.A. [email protected] June2,2015 1 Introduction This is a proposal to encode the Gondi script created by Mangal Singh Masaram in 1918 in Unicode. It replacesandsupersedesthefollowingdocuments: • L2/10-207“PreliminaryProposaltoEncodetheGondiScriptintheUCS” • L2/12-235“RevisedPreliminaryProposaltoEncodetheGondiScript” • L2/15-005“ProposaltoEncodetheGondiScript” Thisdocumentprovidesadescriptionofthewritingsystem,acodechartandnameslist,characterproperties, andspecimensthatillustrateletterformsandusage. ItisarevisionofL2/15-005andcontainsseveralchanges totheencodingproposedinthatdocument. Themajorchangesareasfollows: • Theblocknamehasbeenchangedfrom‘Gondi’to‘MasaramGondi’ • Separateencodingof (cid:3467)(cid:3454)(cid:3465)(cid:3457)(cid:3450)ascluster-initialand(cid:3467)(cid:3450)-(cid:3460)(cid:3450)(cid:3467)(cid:3450)ascluster-finalformsof (cid:3467)(cid:3450) • Redefinitionof (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)specificallyasacontrolcharacterusedonlyforproducingconjuncts • Additionof (cid:3457)(cid:3450)(cid:3461)(cid:3450)(cid:3463)(cid:3469)(cid:3450)asacombiningsignusedsolelyforsilencingtheinherentvowel • Additionof (cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)fortranscribingforeignvowelsounds These changes were introduced as a result of discussions with experts such as Mukund Gokhale, members oftheusercommunity,andwithUnicodeimplementersatGoogleandMicrosoft. The ‘Masaram Gondi’ script is graphically and structurally distinct from another Gondi script known as ‘GunjalaGondi’. Apreliminaryproposalfor‘GunjalaGondi’hasbeensubmitted(seeL2/15-086). The symbol appears in several sources containing Masaram’s script and is a common Gond motif (see figures10,21). Thissymbolrepresentspersapen,orthesupremespirit,intheindigenousGondphilosophical systemknownaskoyapunem. Thissymbolhasbeenproposedforencodinginthe‘MiscellaenousSymbols andPictographs’blockinUnicode,whereseveralreligioussymbolsareencoded(seeL2/15-111). 1 ProposaltoEncodetheMasaramGondiScriptinUnicode AnshumanPandey 2 Background The script described here was invented by Munshi Mangal Singh Masaram of Kochewada, Balaghat Dis- trict,MadhyaPradesh,Indiain1918. Ithasnogeneticrelationshiptootherwritingsystems,butitisbased upontheBrahmimodel. ThescriptwasdesignedforwritingGondi(ISO639-3: gon),aDravidianlanguage spokenby2.6millionpeople,primarilyinMadhyaPradeshandMaharashtra,withsomespeakersinAndhra Pradesh and Chhattisgarh. The language is generally written in both Devanagari and Telugu. Manuscripts containing yet another script, which appears to have been graphically inspired by these Modi writing sys- tem, was found in Gunjala in the Adilabad district of Telangana Masaram’s Gondi script is actively used today for hand-written and printed materials. Fonts have been developed for the production of books. In 2011,theAkhilGondvanaGondiSahityaParishad(Chandagadh,Maharashtra)passedaresolutionadopting Masaram’sscriptastheofficialscriptoftheGondilanguage. Masaram’s script has been slightly expanded and revised over the years in order to meet the needs and preferences of modern users. Innovations include the addition of new consonant letters, vowel signs, a vowel-sound modifier, and the adoption of a Devanagari-style halanta for indicating the absence of the inherentvowel. Someofthesenewcharactersareincludedintheproposedrepertoire,whileothersarenot (seesection4.12). 3 ScriptDetails 3.1 Name Earlierversionsofthisproposalreferredtonameofthescriptblockas‘Gondi’. Whilethescriptiscertainly used for writing Gondi, it is one of many scripts used for the language. Moreover, the ‘Gunjala Gondi’ script is also associated with the language and culture of the Gonds. Given this, it is appropriate to assign an identifier for the script block that precisely defines which ‘Gondi’ script is contained within that block. A designation that includes the name of the script’s creator seems appropriate. For this reason, the name suggested for the script block in Unicode is ‘Masaram Gondi’. The names of characters contain the block name. Usersmayrefertothescriptas‘Gondi’orbywhatevernametheypreferoutsideofaUnicodecontext. 3.2 Structure Masaram’sGondiscriptisanalphasyllabarythatiswrittenfromlefttoright. Consonantletterspossessthe inherent vowel a, which is graphically represented by a horizontal stroke that extends rightward from the rightedgeofeachconsonantletter. Abareconsonantisrepresentedbyremovingthisstroke. Somemodern usersrepresentaword-finalbareconsonantbywritingthehalantabeneaththestrokeoftheconsonantletter. Consonant clusters are represented as conjuncts, which are rendered as a linear sequence using bare forms for all consonants except for the final, which occurs in its regular form. There are some exceptions to this rule, namely the behavior of ra and the usage of distinctive letter ligatures for the conjuncts kṣa, jña, tra. Independent and initial vowels are written using vowel letters, while consonant-vowel combinations are expressedusingdependentsigns. Thereisnomātrāreordering. 3.3 CharacterRepertoire A total of 75 characters are proposed for encoding in the ‘Masaram Gondi’ script block. A code chart and nameslistareattached. NamesforcharactersfollowtheUCSconventionforBrahmi-basedscriptsandalign withtheLatintransliterationofDevanagarianaloguesforGondilettersgivenbyB.S.Masaram(1951). 2 ProposaltoEncodetheMasaramGondiScriptinUnicode AnshumanPandey 3.4 GlyphicRepresentations The glyphic representations of some consonant letters and digits have changed since the invention of the script. These differences result from the simplification of glyphs for ease of writing, ie. sets of indepen- dent circles being joined into a single-stroked loop. Representative glyphs are based upon forms shown in publishedscriptprimersandreflectmodernpreferences. Thefontwasdesignedbytheproposalauthor. 4 ProposedEncoding 4.1 VowelLetters Tenvowellettersareproposedforencoding: 𑴀 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3450) 𑴅 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3470)(cid:3470) 𑴁 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3450)(cid:3450) 𑴆 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3454) 𑴂 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3458) 𑴈 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3450)(cid:3458) 𑴃 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3458)(cid:3458) 𑴉 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3464) 𑴄 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3470) 𑴋 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3450)(cid:3470) Masaram’s script does not have independent letters or dependent signs for the Dravidian long vowels /eː/ and/oː/,whichcorrespondtoTelugu ē ((cid:3470)+0C0F (cid:3469)(cid:3454)(cid:3461)(cid:3470)(cid:3456)(cid:3470) (cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467) (cid:3454)(cid:3454))and ō((cid:3470)+0C0F (cid:3469)(cid:3454)(cid:3461)(cid:3470)(cid:3456)(cid:3470) (cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467) ఏ ఓ (cid:3464)(cid:3464)). Spaceisreservedinthescriptblockinthecasethatattestationsforthesecharactersareidentified. 4.2 VowelSigns Tendependentvowelsignsareproposedforencoding: ◌𑴱 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3450) ◌𑴶 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3471)(cid:3464)(cid:3452)(cid:3450)(cid:3461)(cid:3458)(cid:3452)(cid:3467) ◌𑴲 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3458) ◌𑴺 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3454) ◌𑴳 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3458)(cid:3458) ◌𑴼 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3458) ◌𑴴 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3470) ◌𑴽 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3464) ◌𑴵 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3470)(cid:3470) ◌𑴿 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3470) Vowelsignsarewrittenaboveandbelowthehorizontalstrokeofaconsonantletter: 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 ka kā ki kī ku kū kr̥ ke kai ko kau Thesecombinationswouldberepresentedinencodedtextasfollows: kā 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴱(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3450)> ki 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴲(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3458)> 3 ProposaltoEncodetheMasaramGondiScriptinUnicode AnshumanPandey kī 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴳(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3458)(cid:3458)> ku 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴴(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3470)> kū 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴵(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3470)(cid:3470)> kr̥ 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴶(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3471)(cid:3464)(cid:3452)(cid:3450)(cid:3461)(cid:3458)(cid:3452)(cid:3467)> ke 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴺(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3454)> kai 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴼(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3458)> ko 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴽(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3464)> kau 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴿(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3470)> Thereisnoindependentletteranaloguefor(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3471)(cid:3464)(cid:3452)(cid:3450)(cid:3461)(cid:3458)(cid:3452)(cid:3467). Theindependentformofthisvowelis representedusingaconsonant-vowelcombinationcomposedwiththeletter(cid:3467)(cid:3450): r̥ 𑴦 <𑴦(cid:3467)(cid:3450),◌𑴶(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3471)(cid:3464)(cid:3452)(cid:3450)(cid:3461)(cid:3458)(cid:3452)(cid:3467)> 4.3 Consonants Thereare34consonantletters: 𑴌 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3460)(cid:3450) 𑴝 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3453)(cid:3450) 𑴍 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3460)(cid:3457)(cid:3450) 𑴞 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3453)(cid:3457)(cid:3450) 𑴎 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3456)(cid:3450) 𑴟 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3463)(cid:3450) 𑴏 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3456)(cid:3457)(cid:3450) 𑴠 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3465)(cid:3450) 𑴐 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3463)(cid:3456)(cid:3450) 𑴡 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3465)(cid:3457)(cid:3450) 𑴑 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3452)(cid:3450) 𑴢 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3451)(cid:3450) 𑴒 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3452)(cid:3457)(cid:3450) 𑴣 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3451)(cid:3457)(cid:3450) 𑴓 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3459)(cid:3450) 𑴤 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3462)(cid:3450) 𑴔 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3459)(cid:3457)(cid:3450) 𑴥 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3474)(cid:3450) 𑴕 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3463)(cid:3474)(cid:3450) 𑴦 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3467)(cid:3450) 𑴖 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3469)(cid:3469)(cid:3450) 𑴧 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3461)(cid:3450) 𑴗 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3469)(cid:3469)(cid:3457)(cid:3450) 𑴨 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3471)(cid:3450) 𑴘 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3453)(cid:3453)(cid:3450) 𑴩 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3468)(cid:3457)(cid:3450) 𑴙 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3453)(cid:3453)(cid:3457)(cid:3450) 𑴪 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3468)(cid:3468)(cid:3450) 𑴚 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3463)(cid:3463)(cid:3450) 𑴫 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3468)(cid:3450) 𑴛 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3469)(cid:3450) 𑴬 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3457)(cid:3450) 𑴜 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3469)(cid:3457)(cid:3450) 𑴭 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3461)(cid:3461)(cid:3450) The letter 𑴭 (cid:3461)(cid:3461)(cid:3450) is not part of Masaram’s original script. It was introduced by modern users in order to properlyrepresentMarathiळḷa(seefigure19foranexampleof (cid:3461)(cid:3461)(cid:3450)inusage). 4 ProposaltoEncodetheMasaramGondiScriptinUnicode AnshumanPandey Thehorizontalstrokeofalettermaybeextendedinordertoaccommodatetheplacementofmultiplecom- biningsigns. Examplesareshownthroughouttheproposalindiscussionsoftherelevantsigns. 4.4 Vowelmodifiers Threevowelmodifiersareproposedforencoding: ◌𑵀 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3463)(cid:3470)(cid:3468)(cid:3471)(cid:3450)(cid:3467)(cid:3450) ◌𑵁 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3471)(cid:3458)(cid:3468)(cid:3450)(cid:3467)(cid:3456)(cid:3450) ◌𑵃 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450) Anusvara Thesign◌𑵀(cid:3450)(cid:3463)(cid:3470)(cid:3468)(cid:3471)(cid:3450)(cid:3467)(cid:3450)isusedformarkingnasalization. Itisplacedabovethehorizontalstroke of a consonant. Its position differs slightly in different sources. In some documents the position is altered bythepresenceofanaccompanyingabove-basevowelsign: 𑴌 𑴌 𑴌𑵀 𑴌𑵀 𑴌𑵀 𑴌𑵀 𑴌 𑴌𑵀 𑴌𑵀 𑴌𑵀 𑴌𑵀 Asshownabove,the(cid:3450)(cid:3463)(cid:3470)(cid:3468)(cid:3471)(cid:3450)(cid:3467)(cid:3450)isplacedabovethestrokewhenthereisnovowelsignorthevowelsignis below the stroke. Its position is raised when ◌𑴱 (cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461) (cid:3468)(cid:3458)(cid:3456)(cid:3463) (cid:3450)(cid:3450) is present. It is placed to the right of ◌𑴲 (cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3458),◌𑴳(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3458)(cid:3458), ◌𑴴(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3470),◌𑴵(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3470)(cid:3470),◌𑴺(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3454),◌𑴼(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463) (cid:3450)(cid:3458). Itisplacedtotherightandraisedhigherwith◌𑴽(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3464),◌𑴿(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3470). Somemodernusers preferamorestationarypositionfor(cid:3450)(cid:3463)(cid:3470)(cid:3468)(cid:3471)(cid:3450)(cid:3467)(cid:3450)andplaceitabovethebodyoftheconsonant: 𑵀 𑵀 𑵀 𑵀 𑵀 𑵀 𑵀 𑵀 𑵀 𑵀 𑵀 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 These positional preferences are to be managed in the font. The sign (cid:3450)(cid:3463)(cid:3470)(cid:3468)(cid:3471)(cid:3450)(cid:3467)(cid:3450) is used in encoded text as shownbelow. Itisalwaysplacedafteravowelsignintheencodedsequence: kaṃ 𑴌 <𑴌(cid:3460)(cid:3450),◌𑵀(cid:3450)(cid:3463)(cid:3470)(cid:3468)(cid:3471)(cid:3450)(cid:3467)(cid:3450)> kāṃ 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴱(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3450),◌𑵀(cid:3450)(cid:3463)(cid:3470)(cid:3468)(cid:3471)(cid:3450)(cid:3467)(cid:3450)> kīṃ 𑴌𑵀 <𑴌(cid:3460)(cid:3450),◌𑴳(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3458)(cid:3458),◌𑵀(cid:3450)(cid:3463)(cid:3470)(cid:3468)(cid:3471)(cid:3450)(cid:3467)(cid:3450)> kr̥ ṃ 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴶(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3471)(cid:3464)(cid:3452)(cid:3450)(cid:3461)(cid:3458)(cid:3452)(cid:3467),◌𑵀(cid:3450)(cid:3463)(cid:3470)(cid:3468)(cid:3471)(cid:3450)(cid:3467)(cid:3450)> Visarga The◌𑵁(cid:3471)(cid:3458)(cid:3468)(cid:3450)(cid:3467)(cid:3456)(cid:3450)isusedfortherepresentationofSanskritwords. Itiswrittenabovethehorizontal lineofaconsonantletter. Whenoccurringwithvowelsignsitspositionisadjustedasfollows: 𑴌 𑴌 𑴌𑵁 𑴌𑵁 𑴌𑵁 𑴌𑵁 𑴌 𑴌𑵁 𑴌𑵁 𑴌𑵁 𑴌𑵁 Somemodernsourcesshowthe◌𑵁(cid:3471)(cid:3458)(cid:3468)(cid:3450)(cid:3467)(cid:3456)(cid:3450)writtenastheglyphicvariant◌. Itisplacedafterthestroke: 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 The(cid:3471)(cid:3458)(cid:3468)(cid:3450)(cid:3467)(cid:3456)(cid:3450)isusedinencodedtextasfollows: 5 ProposaltoEncodetheMasaramGondiScriptinUnicode AnshumanPandey kaḥ 𑴌 <𑴌(cid:3460)(cid:3450),◌𑵁(cid:3471)(cid:3458)(cid:3468)(cid:3450)(cid:3467)(cid:3456)(cid:3450)> kāḥ 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴱(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3450),◌𑵁(cid:3471)(cid:3458)(cid:3468)(cid:3450)(cid:3467)(cid:3456)(cid:3450)> Candra The sign ◌𑵃 (cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450) is used for transcribing vowel sounds that do not occur natively in Gondi. Examplesaregiveninfigure25. Itisderivedfromthesign◌ॅusedinDevanagariorthographyforMarathi forrepresentingtheEnglishvowelsounds/æ/and/ɔ/. The(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)iswrittenabovethehorizontallineofa consonantletter,andisusedasfollows: /æ/ 𑴆 <𑴆(cid:3454),◌𑵃(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)> /ɔ/ 𑴁 <𑴁(cid:3450)(cid:3450),◌𑵃(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)> /kæ/ 𑴌 <𑴌(cid:3460)(cid:3450),◌𑵃(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)> /kɔ/ 𑴌 <𑴌(cid:3460)(cid:3450),◌𑴱(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3450),◌𑵃(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)> Ininitialandindependentcontexts,(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)isusedonlywiththevowelletters(cid:3454)and(cid:3464)forrepresenting/æ/ and/ɔ/,respectively. Thecombination𑴆correspondstoऍ (cid:3470)+090D (cid:3453)(cid:3454)(cid:3471)(cid:3450)(cid:3463)(cid:3450)(cid:3456)(cid:3450)(cid:3467)(cid:3458) (cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467) (cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450) (cid:3454),while 𑴁correspondstoऑ(cid:3470)+0911 (cid:3453)(cid:3454)(cid:3471)(cid:3450)(cid:3463)(cid:3450)(cid:3456)(cid:3450)(cid:3467)(cid:3458) (cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467) (cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450) (cid:3464). Independentcontexts,the(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)combines with a consonant letter for the sound /æ/, and with the (cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461) (cid:3468)(cid:3458)(cid:3456)(cid:3463) (cid:3450)(cid:3450) for the sound /ɔ/. The ◌𑵃 (cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450) correspondsto◌ॅ(cid:3470)+0945 (cid:3453)(cid:3454)(cid:3471)(cid:3450)(cid:3463)(cid:3450)(cid:3456)(cid:3450)(cid:3467)(cid:3458) (cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461) (cid:3468)(cid:3458)(cid:3456)(cid:3463) (cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450) (cid:3454),whilethesequence<◌𑴱(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461)(cid:3468)(cid:3458)(cid:3456)(cid:3463) (cid:3450)(cid:3450), ◌𑵃 (cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)> corresponds to ◌ॉ (cid:3470)+0949 (cid:3453)(cid:3454)(cid:3471)(cid:3450)(cid:3463)(cid:3450)(cid:3456)(cid:3450)(cid:3467)(cid:3458) (cid:3471)(cid:3464)(cid:3472)(cid:3454)(cid:3461) (cid:3468)(cid:3458)(cid:3456)(cid:3463) (cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450) (cid:3464). Although the Gondi sequences correspond to atomic characters in Devanagari, there is no need to encode such precomposed lettersandsignswith(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)forGondi. Althoughthecontextsinwhich(cid:3452)(cid:3450)(cid:3463)(cid:3453)(cid:3467)(cid:3450)isusedarelimited,thesigntechnicallymaybeusedwithanyletter andmayoccurwithanyvowelsign. Itwouldbepositionedwithothervowelsignsasfollows: 𑴌 𑴌 𑴌𑵃 𑴌𑵃 𑴌𑵃 𑴌𑵃 𑴌 𑴌𑵃 𑴌𑵃 𑴌𑵃 𑴌𑵃 4.5 Nukta The◌𑵂(cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3463)(cid:3470)(cid:3460)(cid:3469)(cid:3450)isusedforrepresentingsoundsthatarenotnativetotheGondilanguage. Itiswrittenbeneaththehorizontalstrokeofaconsonant: 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 Someusersprefertopositionthe(cid:3463)(cid:3470)(cid:3460)(cid:3469)(cid:3450)belowthebodyoftheconsonantletter: 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑵂 𑵂 𑵂 𑵂 𑵂 𑵂 𑵂 𑵂 𑵂 𑵂 𑵂 These positional preferences are to be managed in the font. The (cid:3463)(cid:3470)(cid:3460)(cid:3469)(cid:3450) is used in encoded text as shown below. Notethatthe(cid:3463)(cid:3470)(cid:3460)(cid:3469)(cid:3450)isalwaysplacedaftervowelsignsinanencodedsequence: 6 ProposaltoEncodetheMasaramGondiScriptinUnicode AnshumanPandey ṛa 𑴘 <𑴘(cid:3453)(cid:3453)(cid:3450),◌𑵂(cid:3463)(cid:3470)(cid:3460)(cid:3469)(cid:3450)> ṛā 𑴘 <𑴘(cid:3453)(cid:3453)(cid:3450),◌𑵂(cid:3463)(cid:3470)(cid:3460)(cid:3469)(cid:3450),◌𑴱(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3450)(cid:3450)> 4.6 Halanta The◌𑵄(cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3457)(cid:3450)(cid:3461)(cid:3450)(cid:3463)(cid:3469)(cid:3450)isproposedasavowelsilencer. Itisusedasfollows: k 𑴌 <𑴌(cid:3460)(cid:3450),◌𑵄(cid:3457)(cid:3450)(cid:3461)(cid:3450)(cid:3463)(cid:3469)(cid:3450)> kh 𑴍 <𑴍(cid:3460)(cid:3457)(cid:3450),◌𑵄(cid:3457)(cid:3450)(cid:3461)(cid:3450)(cid:3463)(cid:3469)(cid:3450)> TheGondiscriptasdesignedbyMasaramdoesnothaveanativehalanta,asthestructureofthescriptdoes notrequireit. Theembeddingoftheinherentvowelintothegraphicalstructureofaconsonantisaunique and innovative feature of the Gondi script. The horizontal stroke of each consonant letter represents the inherentvowel;removalofthisstrokeproducesabareconsonant: 𑴌ka→k,etc. In most Indic scripts the inherent vowel is not part of the graphical structure of a consonant letter. As a result,thesescriptsrequireamechanismforindicatingtheabsenceoftheinherentvowel. InDevanagarithis mechanismisasigncalled◌्(cid:3470)+094D (cid:3453)(cid:3454)(cid:3471)(cid:3450)(cid:3463)(cid:3450)(cid:3456)(cid:3450)(cid:3467)(cid:3458) (cid:3468)(cid:3458)(cid:3456)(cid:3463) (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450): कka+◌्→क् k,etc. However, modernusershaveadoptedtheDevanagarihalanta(or (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450))formarkingabareconsonantat theendofaword(seefigure24). The(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3457)(cid:3450)(cid:3461)(cid:3450)(cid:3463)(cid:3469)(cid:3450)hasbeenincludedintherepertoireinorderto providethisfunctionalityintheproposedencoding. TheproposedencodingforGondiseparatesthetwofunctionsofthe(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)characterasusedinthemodels formostIndicscriptsinUnicode. InDevanagari,forexample,the(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)functionsbothasavowelsilencer (halanta)andacontrolcharacterforformingconjuncts. Thedefaultrepresentationof (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)inDevanagari isasavisiblesignbeneaththeconsonantwithwhichitcombines. Ifaconsonantisplacedafterthe(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450) it causes a conjunct to be formed from the two consonants around it. In order to display a visible (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450) between adjacent consonants, it is necessary to break conjunct formation. For this purpose, the control character (cid:3470)+200C (cid:3475)(cid:3454)(cid:3467)(cid:3464) (cid:3472)(cid:3458)(cid:3453)(cid:3469)(cid:3457) (cid:3463)(cid:3464)(cid:3463)-(cid:3459)(cid:3464)(cid:3458)(cid:3463)(cid:3454)(cid:3467) is placed after (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450). This approach was proposed for Gondi in L2/15-005. However, in the interest of developing a simple encoding model for Gondi, and to eliminatetheneedforusageof (cid:3475)(cid:3454)(cid:3467)(cid:3464)(cid:3472)(cid:3458)(cid:3453)(cid:3469)(cid:3457)(cid:3463)(cid:3464)(cid:3463)-(cid:3459)(cid:3464)(cid:3458)(cid:3463)(cid:3454)(cid:3467)orotherinvisiblecontrolcharacters,theencoding ofthe vowel silencing feature of theIndic(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)hasbeen encapsulated into the character◌𑵄 (cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3468)(cid:3458)(cid:3456)(cid:3463) (cid:3457)(cid:3450)(cid:3461)(cid:3450)(cid:3463)(cid:3469)(cid:3450). Theconjunctformingfunctionisretainedinthe(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),describedbelow. 4.7 Virama The ◌𑵅 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)isacontrolcharacterthatisusedspecificallyforproducingthebareformof aconsonantletter. Itisrepresentedinthecodechartas𑵅inordertoindicatethatitisaspecialcharacter. Conceptually, (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450) produces a half-form by removing the horizontal stroke from the glyph of the letter afterwhichitisplaced. k <𑴌(cid:3460)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)> kh <𑴍(cid:3460)(cid:3457)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)> Itisusedforproducingconjuncts,similartothecontrolfunctionof◌्(cid:3470)+094D (cid:3453)(cid:3454)(cid:3471)(cid:3450)(cid:3463)(cid:3450)(cid:3456)(cid:3450)(cid:3467)(cid:3458) (cid:3468)(cid:3458)(cid:3456)(cid:3463) (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450). TheGondi(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),however,isnotdesignedforsilencingtheinherentvowel;the◌𑵄(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3468)(cid:3458)(cid:3456)(cid:3463)(cid:3457)(cid:3450)(cid:3461)(cid:3450)(cid:3463)(cid:3469)(cid:3450) istobeusedforthatpurpose. 7 ProposaltoEncodetheMasaramGondiScriptinUnicode AnshumanPandey 4.8 ConsonantConjuncts Consonant clusters are represented as conjuncts and are rendered in a linear sequence using half-forms of all but the final letter in a cluster, which appears in its full form, eg. 𑴌 kka, 𑴛 kta, 𑴨 ktva, etc. Consonantsareplacedsequentiallyintheconjunctintheorderthattheyoccurinthecluster. Conjunctsarerepresentedinencodedtextbyplacingthecontrolcharacter◌𑵅(cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)after eachnon-initialconsonantinacluster. Thesequence<(C,◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450))*,C>producesahalf-formofallCthat precedethe(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),whiletheC thatimmediatelyfollowsisrenderedusingitsregularfullform: ka 𑴌 <𑴌(cid:3460)(cid:3450)> kta 𑴛 <𑴌(cid:3460)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴛(cid:3469)(cid:3450)> ktva 𑴨 <𑴌(cid:3460)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴛(cid:3469)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴨(cid:3471)(cid:3450)> ktvya 𑴥 <𑴌(cid:3460)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴛(cid:3469)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴨(cid:3471)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴥(cid:3474)(cid:3450)> Therearesomeexceptionstotheruleofconjunctformation. Thefollowingcharacterareproposedinorder toproperlyrepresentallGondiconjuncts: 𑵆 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3467)(cid:3454)(cid:3465)(cid:3457)(cid:3450) ◌𑵇 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3467)(cid:3450)-(cid:3460)(cid:3450)(cid:3467)(cid:3450) 𑴮 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3460)(cid:3468)(cid:3468)(cid:3450) 𑴯 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3459)(cid:3463)(cid:3474)(cid:3450) 𑴰 (cid:3462)(cid:3450)(cid:3468)(cid:3450)(cid:3467)(cid:3450)(cid:3462)(cid:3456)(cid:3464)(cid:3463)(cid:3453)(cid:3458)(cid:3461)(cid:3454)(cid:3469)(cid:3469)(cid:3454)(cid:3467)(cid:3469)(cid:3467)(cid:3450) The behavior of (cid:3467)(cid:3450) is described in section 4.8.1, and the use of atomic ligatures for three conjuncts is dis- cussedinsection4.8.2. 4.8.1 Formsof(cid:3467)(cid:3450)inconjuncts Following the general rule of conjunct formation, the letter 𑴦 (cid:3467)(cid:3450) would occur as the half-form when it is initial or medial in a cluster and in its regular full-form when in cluster-final position. The Gondi (cid:3467)(cid:3450), however,doesnotbehaveentirelyasexpectedinconjunctsandisrenderedinseveralways. Therearethree waysofwriting𑴦(cid:3467)(cid:3450)inconjuncts. Itoccursinitshalf-formwhencluster-initialoralternatelyas◌𑵆when cluster-initialandas◌𑵇whencluster-final. Thesearedescribedbelow: • Half-form Thehalf-formof (cid:3467)(cid:3450)isusedspecificallyforrepresentingsemanticdistinctionsof (cid:3467)(cid:3450)when the letter occurs at a morphological boundary. Such usage is influenced by Devanagari orthography for the Marathi language, in which र (cid:3467)(cid:3450) may occur as either the ◌ regular repha or the ◌ ‘eyelash’ repha when it is the initial consonant in a cluster; the ‘eyelash’ repha marks plural suffixes (द(cid:7015) या daryā‘valleys’andदया(cid:6981)daryā‘ocean’)andinflectionalsuffixes(आचा(cid:7015) यासācāryās‘tothecook’and आचाया(cid:6981)सācāryās‘totheteacher’). Thehalf-formcorrespondstotheDevanagari ◌‘eyelash’repha. Itisalsousedwhen(cid:3467)(cid:3450)occursincluster-medialposition. • Repha When not used for marking morphological distinctions, cluster-initial (cid:3467)(cid:3450) is rendered as the ◌𑵆repha. ThelogicofthischaracterisbasedupontheDevanagari◌regularrepha. TheGondirepha 8 ProposaltoEncodetheMasaramGondiScriptinUnicode AnshumanPandey attaches after the last letter in a conjunct, above the horizontal line or an extension of it, depending uponthepresenceofanabove-strokevowelsign,eg. 𑴌rka,𑴌rkā,etc. 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 Some modern sources show the ◌𑵆 repha represented using the form ◌, eg. 𑴌 rka. This form is simplytheregularsignfor◌𑵆rephawiththeleftstrokedrawnpastthehorizontalbarandcurvingto theright. Itisaglyphicvariantandistobehandledbythefont. • Ra-kāra Inthecurrentorthography, cluster-final(cid:3467)(cid:3450)isrenderedas◌𑵇ra-kāra insteadofasthefull form 𑴦. The logic of the Gondi ra-kāra is based upon the Devanagari ◌ ra-kāra and ◌ vattu. The Gondira-kāraispositionedbelowthehorizontallineofaconsonantglyphorbeneathanextensionof thehorizontalline: 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 𑴌 Somemodernsourcesshowthe◌𑵇ra-kārarepresentedusingtheform◌,eg. 𑴌kra. Thisformisa glyphicvariantandistobehandledbythefont. • Full-form The full-form of (cid:3467)(cid:3450) is rarely used at present when it is final in a cluster: 𑴦 kra. The preferenceistouse◌𑵇ra-kāra. The representation of ◌𑵆 repha and ◌𑵇 ra-kāra requires an exception to the rule of conjunct formation in Gondi. The general rule states that the sequence <(cid:3467)(cid:3450), (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450), C> is rendered using the half-form of (cid:3467)(cid:3450) andthefull-formofC.Italsostatesthat<C,(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),(cid:3467)(cid:3450)>wouldproducethehalf-formofCandthefull-form 𑴦of (cid:3467)(cid:3450). Forthisreasonanothermethodisrequiredfortheencodedrepresentationofrephaandra-kāra,for which the expected encoded sequences according to the general model of Indic scripts would also be <(cid:3467)(cid:3450), (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),C>and<C,(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),(cid:3467)(cid:3450)>,respectively. There are four possible models for accommodating encoded representations of (cid:3467)(cid:3450) in conjuncts. The first two are based upon the premise that the default behavior of (cid:3467)(cid:3450) in conjuncts is similar to that of all other consonants, ie. it is rendered using the half-form when cluster-initial and the full-form 𑴦 when cluster- final. Theseapproachestreatrephaandra-kāraasexceptions. Thethirdmodeldeviatesfromthispremise and establishes the repha and ra-kāra as default representations of (cid:3467)(cid:3450) in conjuncts, and the half-form and full-formasexceptions. 1. UsetheZero-WidthJoiner InL2/15-005,itwassuggestedthatthegenericcontrolcharacter(cid:3470)+200D(cid:3475)(cid:3454)(cid:3467)(cid:3464)(cid:3472)(cid:3458)(cid:3453)(cid:3469)(cid:3457)(cid:3459)(cid:3464)(cid:3458)(cid:3463)(cid:3454)(cid:3467)((cid:3475)(cid:3472)(cid:3459)) be used for representing repha and ra-kāra in encoded text. The usage of (cid:3475)(cid:3472)(cid:3459) was chosen because thecharacterisusedinvariousIndicscriptsforcontrollingdifferentformsoflettersinconjuncts. The sameprinciple wasapplied toGondi, such thatvarious formsof (cid:3467)(cid:3450)inconjuncts wouldbe produced asfollows: half-form <𑴦(cid:3467)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),C> repha ◌𑵆 <𑴦(cid:3467)(cid:3450),(cid:3475)(cid:3454)(cid:3467)(cid:3464)(cid:3472)(cid:3458)(cid:3453)(cid:3469)(cid:3457)(cid:3459)(cid:3464)(cid:3458)(cid:3463)(cid:3454)(cid:3467),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),C> ra-kāra ◌𑵇 <C,◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),(cid:3475)(cid:3454)(cid:3467)(cid:3464)(cid:3472)(cid:3458)(cid:3453)(cid:3469)(cid:3457)(cid:3459)(cid:3464)(cid:3458)(cid:3463)(cid:3454)(cid:3467),𑴦(cid:3467)(cid:3450)> 9 ProposaltoEncodetheMasaramGondiScriptinUnicode AnshumanPandey Representationofapproach#1inencodedsequenceswouldbeasfollows: 𑴌 rka <𑴦(cid:3467)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴌(cid:3460)(cid:3450)> 𑴦 kra <𑴌(cid:3460)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴦(cid:3467)(cid:3450)> 𑴌 rka <𑴦(cid:3467)(cid:3450),(cid:3475)(cid:3454)(cid:3467)(cid:3464)(cid:3472)(cid:3458)(cid:3453)(cid:3469)(cid:3457)(cid:3459)(cid:3464)(cid:3458)(cid:3463)(cid:3454)(cid:3467),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴌(cid:3460)(cid:3450)> 𑴌 kra <𑴌(cid:3460)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),(cid:3475)(cid:3454)(cid:3467)(cid:3464)(cid:3472)(cid:3458)(cid:3453)(cid:3469)(cid:3457)(cid:3459)(cid:3464)(cid:3458)(cid:3463)(cid:3454)(cid:3467),𑴦(cid:3467)(cid:3450)> The Script Ad-hoc Committee recommended against the usage of (cid:3475)(cid:3472)(cid:3459) for such cases in Gondi. In L2/15-045,theSubcommitteesuggestedthatanalternativemodelbedevelopedandthat“[f]orrepha and ra-kāra, encoding separate characters may be useful, similar to the Malayalam dot reph and the medial ra in Myanmar and Tai Tham.” The major concern is that usage of (cid:3475)(cid:3472)(cid:3459) introduces issues forbothimplementersandendusers. Forimplementers,theuseof (cid:3475)(cid:3472)(cid:3459)overloadsthescript-specific rulesthatmustbetailoredforeachscript. Forend-users,(cid:3475)(cid:3472)(cid:3459)isproblematicbecauseitisaninvisible controlcharacterandisneitherreadilyavailableonkeyboardsoreasilydetectableintextsequence. 2. Redefinetheruleforrendering<(cid:2578)(cid:2561),(cid:2582)(cid:2569)(cid:2578)(cid:2561)(cid:2573)(cid:2561)> TheabovemodelisbasedonthegeneralruleofconjunctformationinGondi: <C,(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)>produces the half-form of C and therefore <(cid:3467)(cid:3450), (cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450)> should produce the half-form of (cid:3467)(cid:3450). The repha and ra-kāraaretreatedasexceptionstotherule. Athirdapproachforhandlingthedifferentformsof (cid:3467)(cid:3450) inconjunctsistoredefinethedefaultrenderingfor(cid:3467)(cid:3450). Withthisapproachthevariousformsof (cid:3467)(cid:3450)in conjunctswouldbeproducedinafashionsimilartootherIndicscripts: repha ◌𑵆 <𑴦(cid:3467)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),C> ra-kāra ◌𑵇 <C,◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴦(cid:3467)(cid:3450)> Representationofapproach#2inencodedsequenceswouldbeasfollows: 𑴌 rka <𑴦(cid:3467)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴌(cid:3460)(cid:3450)> 𑴌 kra <𑴌(cid:3460)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴦(cid:3467)(cid:3450)> This approach, however, does not provide a means for producing the half-form of (cid:3467)(cid:3450), or even the cluster-final full-form if ever needed. Some mechanism would be required to produce these forms. Inevitably,acontrolcharactersuchas(cid:3475)(cid:3472)(cid:3459)wouldberequired: 𑴌 rka <𑴦(cid:3467)(cid:3450),(cid:3475)(cid:3454)(cid:3467)(cid:3464)(cid:3472)(cid:3458)(cid:3453)(cid:3469)(cid:3457)(cid:3459)(cid:3464)(cid:3458)(cid:3463)(cid:3454)(cid:3467),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),𑴌(cid:3460)(cid:3450)> 𑴦 kra <𑴌(cid:3460)(cid:3450),◌𑵅(cid:3471)(cid:3458)(cid:3467)(cid:3450)(cid:3462)(cid:3450),(cid:3475)(cid:3454)(cid:3467)(cid:3464)(cid:3472)(cid:3458)(cid:3453)(cid:3469)(cid:3457)(cid:3459)(cid:3464)(cid:3458)(cid:3463)(cid:3454)(cid:3467),𑴦(cid:3467)(cid:3450)> ThisapproachisessentiallytheconverseofwhatwasproposedinL2/15-005. Itposesthesameissues asitrequiresusageof (cid:3475)(cid:3472)(cid:3459). 3. Encodealigatingformof(cid:2578)(cid:2561) Another option is to encode a dummy letter whose cluster-initial form is ◌𑵆 repha and whose non- initialformis◌𑵇ra-kāra. Thislettermightbecalled (cid:3461)(cid:3458)(cid:3456)(cid:3450)(cid:3469)(cid:3458)(cid:3463)(cid:3456)(cid:3467)(cid:3450) anditwouldbedefinedforusage 10
Description: