我要投搞

标签云

收藏小站

爱尚经典语录、名言、句子、散文、日志、唯美图片

当前位置:管家婆六肖中特 > 非成字部件 >

元根码输入法教程doc

归档日期:05-28       文本归类:非成字部件      文章编辑:爱尚语录

  1.本站不保证该用户上传的文档完整性,不预览、不比对内容而直接下载产生的反悔问题本站不予受理。

  目录 第一章 中文的信息化书写 1 第一节 一个急待解决而又没有解决的问题 1 第二节 音码输入方法必须抛弃 2 第三节 语音输入和手写输入不能替代键盘书写 2 第四节 中文信息化键盘书写系统 2 第二章 汉字的基本特点与结构理论 5 第一节 汉字是世界上最具信息化特征的文字 5 第二节 汉字的五种笔画 6 第三节 字元与字块——汉字的两种组字部件 8 第三章 中文键盘与字元定位 9 第一节 规范的中文键盘与编码“特区” 9 第二节 字元键位图 11 第三节 字元组字实例 16 第四节 必不可少的中文键盘指法训练 17 第四章 汉字的结构分类与字块分解 19 第一节 汉字的结构分类 19 第二节 字块分解方法 20 第三节 字块分解举例 23 第五章 汉字的三种字型与键盘编码 25 第一节 汉字的三种字型 25 第二节 识别码 25 第三节 汉字键盘编码规则 28 第四节 繁体字的编码 29 第六章 以词语为编码单元的中文书写 31 第一节 词语的编码规则 31 第二节 含有符号的词语的编码 32 第三节 以词语为基本单元的中文书写原则 32 第七章 特殊符号的快速盲打 37 第一节 特殊符号的属性分类 37 第二节 字母类符号的编码规则 38 第三节 表义类符号的编码规则 39 第八章 简码与扩展简码 41 第一节 一级简码与一级扩展简码 41 第二节 二级简码与二级扩展简码 43 第三节 三级简码与三级扩展简码 45 第九章 容错、兼容与自动更正 47 第一节 容错码 47 第二节 全兼容五笔字型 48 第三节 自动更正功能 49 第十章 双态功能的智能化系统 51 第一节 汉字的国家标准 51 第二节 元根码的双态书写功能 53 第三节 重码的智能化处理 55 第四节 元根码的特有操作与编码速查 58 附录Ⅰ 特殊符号编码表 61 表 1 希腊字母编码表 61 表 2 四声韵母编码表 62 表 3 日文假名编码表 63 表 4 常用表义类符号编码表 64 表 5 常用特殊符号英文编码表 66 附录Ⅱ GB2312汉字书写码笔画序检索字典 69 第一章 中文的信息化书写 第一节 我国文化教育现代化中一个急待解决的问题 文化是民族的魂,中文书写文化又是中华民族文化的根。然而,我们正面临着民族文化的根被丢弃的严峻局面。这不仅令许多有识之士十分担忧,而且也引起国际舆论的关注。舆论惊呼,“这种情况已经发展到引起一场文化危机的地步”。造成这一局面的根本原因就是,在电脑与手机成为人们工作与生活的基本工具的今天,中文书写方式的根本变革问题却没有得到解决。要解决这个问题,首先要开发出能够实现这种变革的中文信息化键盘书写系统。所以,中文的信息化书写是我国文化教育现代化进程中一个急待解决的问题。 那么,什么是“信息化书写”? 传统的书写是一种“描画性书写方式”,即用笔在纸上具体描画文字图形的书写方式。而以标准键盘为书写工具、通过双手十指敲击文字的字形信息码实现文字快速盲打的书写方式,称为“信息化书写”。由描画性的“笔书”发展为信息化“键书”,是人类书写方式的一种根本性变革。 一百多年前,西方国家通过使用打字机率先实现了西文书写方式的历史性变革。当时,汉字因为数量庞大,结构复杂,无法像西文那样用打字机进行快速盲打。所以,中国人曾经痛感,汉字由于不能实现书写方式的这一变革而无法步入现代文明。计算机的出现,为中文书写方式的变革提供了可能,这种变革可以通过开发中文信息化书写方法来解决。 与开发汉字输入方法的要求不同,中文信息化书写方法必须同时具备以下三个基本要求: 1、以计算机标准键盘作为书写工具、双手十指都参预敲击的键盘书写; 2、文字的键盘书写码必须建立在汉字字形结构基础上,使键书与笔书在书写文化上保持一致; 3、为所有通用词语提供规范的书写码,能实现以词语为主要书写单元的快速盲打。 信息化书写是要在保留传统书写文化基础上实现书写的现代化。无论从开发的宗旨和要求的目标去看,还是从遵守的规范与实现的意义来说,信息化书写方法与汉字输入方法是两个不同的概念。开发中文的信息化书写方法,将几千年又累又慢的传统书写换成轻松快速的键盘书写,这是中国人一百多年来梦寐以求的事情,也是实现我国文化教育信息化的一个迫切需要解决的问题。元根码正是基于这一点,为解决中文的信息化书写问题而开发的。 第二节 音码输入方法必须抛弃 我国在1958年颁布实施了《汉语拼音方案》,这个方案是为了解决汉字的注音而制定的。由于汉语拼音是用标准键盘上的英文字母作为汉字的注音符号,因此可以直接借用它作为汉字的一种输入方法。汉语拼音早在50多年前就被纳入我国九年制义务教育,所以国人用它输入常用汉字时,不需要另外学习就可以使用。这也造成了目前我国大多数人都是用拼音或由其派生的其它音码输入法输入中文。由此,业界有人认为,《汉语拼音方案》不仅解决了汉字的注音问题,同时也解决了中文的键盘书写问题。 然而,现实情况告诉我们,这种看法是完全错误的。二十多年的实践证明,汉语拼音虽然可以用来输入常用汉字,但使用它却存在很多问题。其中最主要的两个问题是: 第一、拼音输入法只能输入常用汉字,面对7万多个国标汉字,大多数是无法输入的。因为用拼音输入汉字的前提是,用户必须认识所要输入的字(知道它的正确读音)。大部分用户(包括学生、知识分子、国家公务员)能够认识的汉字一般都在3000~3500个左右, 也就是说,95%以上的汉字无法用拼音输入。而能不能对所有汉字作到见字知码、快速输入,直接关系到中文信息处理的全面解决和我国文化教育的现代化。在西方国家,西文的电子字典(或电子词典)早就在使用,而中国人为什么至今还在使用老式的纸质字典呢?就是因为大多数人对不认识的字无法用拼音输入来检索它,即使有了汉字电子字典也无法使用。 第二、用拼音输入中文虽然也是在键盘上敲击汉字的信息码,但敲击的是汉字的注音信息码。汉字的注音信息与体现汉字文化的字形信息毫无关系。中文的文化内涵主要是汉字的字型结构体现的,所以,拼音输入是一种脱离汉字文化的中文输入,它在敲击键盘时没有汉字的传统书写概念。而信息化书写则是在保持中文书写原则基础上的键盘书写,它与传统书写的区别只是将字形部件的描画书写变为字形部件的信息化敲击书写。实际上,西方人在用键盘打字时,敲击的就是西文的字形信息码,西文键书与西文笔书在书写文化上是一致的。目前,我国大多数人都用背离中文书写文化的音码输入中文,这正是我国中文信息化道路上的严重问题所在,也是让有识专家们最为担心的问题。中国青年报曾有一项调查显示,现在我国的青少年83%以上的人承认自己书写困难——“提笔忘字”,这在过去并不多见。造成这种情况的原因就是他们长期使用拼音打字、发短信。这种情况如果不改变,我们的后代都将成为新型“文盲”,这将是灾难性的民族文化危机。 使用音码输入法既不能解决电子字典的使用问题,又会造成中文书写文化的丢弃。对我国文化教育事业来说,这是两个极为严重的问题。为了我国文化教育信息化进程的健康发展,必须坚决抛弃音码输入方法。 第三节 语音输入和手写输入不能替代键盘书写 有人预言,文字的计算机输入技术将发生质的变革,将由键盘输入改为“语音”和“手写”方法输入,认为键盘编码已经过时。 究竟应该如何看待这个问题呢?实际上,早在二十年前就有人认为,语音输入和手写输入是今后中文输入研究应用的主要方向。而且二十多年来,很多人都在从事语音输入系统或手写输入系统的研究和开发,也推出了许多这样的应用软件,但是,至今也没有发生专家所说的“质的变革”,无论是国内还是国外,人们都还是用键盘来输入文字。可以说,语音输入和手写输入不仅过去没有,而且今后也永远不可能替代键盘输入。因为: 1、手写输入是保留了原始的、落后的描画性书写方式的汉字输入方法,效率很低。当初是为那些不会汉语拼音、不会输入方法的老年人解决汉字输入而开发的,很少有人使用,没有什么实用价值。 2、语音输入是利用语音识别系统将话音转化为文字,其开发的初衷是提高文字的输入效率,希望它的输入速度达到用户的讲话速度。而实际上,由于它在使用上很不方便,加上局限性太大,极不实用。语音输入只能对那些有明确含意的通用词语的读音才能识别,而很难识别诸如单字、普通人名、一般的村镇地名、古文等读音,对于含有很多数学符号和英文字母的现代科技文章也难以输入,误码率很高,修改起来更为麻烦。语音输入的上述问题使得它在作为中文输入工具时,不仅不能提高效率,根本就无法使用。 语音输入不仅存在应用层面上的上述问题,更为严重的是,它在使用时只动嘴不动手,与文字书写毫不相干,长期使用它人们还会写字吗?都不会写字了,这不就等于丢弃了中华民族的传统文化的根本吗?关键的问题就在于,我们决不能由于技术的发展而丢弃民族书写文化。语音输入作为一个科研课题,可以进行开发研究,也有可能用在某些特定场合,但不会成为一种通用的中文输入方法。 语音输入与手写输入是一种没有多大实用价值的输入方法,永远也不可能代替文字的键盘书写。利用标准键盘实现的信息化书写,代表的是现代化的书写方式,最方便、最快捷、最廉价、最通用,永远不会被淘汰。 第四节 中文信息化键盘书写系统 通过对中文书写问题的上述分析,不难得出这样的结论:现在,我们的当务之急是要开发和推广中文信息化键盘书写系统,尽快建立起民族键盘书写文化。元根码正是基于建立民族键盘书写文化这一根本宗旨,为解决中文的信息化书写问题,在对汉字的结构特点深入研究的基础上开发出来的。它是一个针对七万个国标汉字、十五万条通用词语和五百多个特殊符号,按照双态书写原则开发的智能化键书系统。其主要特点是: (1)规范易学,宜全面纳入中小学基础教育 元根码是以构成汉字的字元为根据建立中文键盘书写码的,既符合中文的书写文化规范,又符合信息化原则。规范易学是元根码的第一特点,它的字元、分解、编码等概念符合我国国民教育的知识背景,符合人们对汉字的认知心理和书写习惯,完全可以和中小学的语文教学相结合。元根码的基本目标,就是要使信息化书写全面纳入我国基础教育。 (2)实现了以词语为书写单元的中文高速盲打 构成语言的基本单位是词语,中文信息化书写也就是以词语为主要书写单元的键盘书写。元根码为所有通用词语(约15万条)提供了信息化的书写码,每条词语的码长均为4个码元,加之智能化的软件设计,实现了中文的无键选书写。所以,元根码是以词语为主要书写单元的中文高速盲打系统。 (3)支持超大字符集汉字的快速书写 元根码为GB13000-2010国家标准(等同国际标准ISO/IEC 10646:2003)的7万多汉字均提供了书写码,支持所有生僻字与繁体字的快速书写。汉语电子字典的应用问题,人名和地名中生僻字的输入问题,以及国际交流、汉字研究等领域涉及的冷僻字与罕用字的录入问题,都能够通过推广使用元根码得以完满解决。 (4)人人都可用它对特殊符号快速盲打 所谓特殊符号就是指在各种文稿中,特别是科技论文、教材和各学科的电子教案中频繁出现的单位符号(如:℃ ‰ ㎡)、数字序号(如:① ② Ⅳ)、数学符号(如:≈ ≌ ≤ △ ∑ ∮)、拉丁字母(如:λ π ω Ω)等字符,它们都是键盘上没有的图形符号,人们通常是利用系统提供的特殊符号列表,通过查表方法来实现它们的输入,既麻烦又费时。解决特殊符号的快速盲打,是全面实现信息化书写的一个方面。元根码根据特殊符号的称谓或读音这一人们熟知的基本属性,利用扩展编码技术,为它们提供了信息化的书写码。只要知道其编码规则,任何人即可做到对特殊符号见“字”知码,快速盲打。元根码是全面实现信息化书写的系统。 (5)具有完善的容错功能和自动更正功能 元根码提供了多种容错码,具有很强的容错性。元根码还提供了智能化的别字纠错功能。人们在书写词语时,常常出现错别字,元根码的纠错功能可以自动将错别字加以更正。元根码的容错能与纠错功能进一步增强它的实用性。 元根码解决了古老的表意文字向信息时代跨越的一个关键问题。它的推广与普及是一项建立民族键盘书写文化的系统工程,对我国文化教育事业的现代化,对于把汉字文化打造成为国际文化品牌,促进汉语全面走向世界都具有深远意义。 第二章 汉字的基本特点与结构理论 一个汉字,它具有形、音、义三个基本属性。要解决中文的信息化书写,首先要根据汉字的字形属性,找出内在规律,编制出汉字的键盘书写信息代码,即所谓的“键盘编码”。本章将从键盘编码角度,阐明汉字的特点与构形理论。 第一节 汉字是世界上最具信息化特征的文字 汉字是当今世界上历史最悠久的文字。经过几千年发展演变,世界上的表意文字除了汉字,都已经失传,唯独汉字使用至今。汉字几千年来之所以常用不衰,具有强大的生命力,说明它有许多其它文字所没有的独特优点。 但是,汉字在近代却受到许多非议。一百多年前,由于打字机的出现使西方国家实现了文字书写方式的历史性变革;而汉字由于数量庞大、结构复杂,难以实现键盘快速打字。看到这一情况,中国的知识界有部份人以为:汉字是一种落后的、不科学的文字,中国近代的落后与汉字有关,中国要现代化非改革汉字不可。直到二十世纪七、八十年代,还有学者主张完全屏弃方块汉字,改为拉丁字母拼音文字。这当然是行不通的!要知道,汉字它不仅仅是汉语的记载符号,它更是中华文化的载体,屏弃它也就等于屏弃我国的传统文化。何况,任何一种文字都是历史选择的结果,它的去留不由人们的主观意愿来决定。 实际上,认为汉字是一种落后的、不科学的观点是完全错误的。西文是由西文字母排列组合而成,每一个字(词)相当于一个键盘书写码串,是码串式的文字。而汉字是通过笔画在二维空间上建立的比较复杂的图形结构,每个字相当于一个独立的小图画,是图象化的文字。图象化文字的最大特点是具有博大精深的文化内涵,这正是码串式文字所望尘莫及的。正因为汉字是图象化文字,所以它是世界上视觉信息特点最好的文字。主要表现在以下三个方面: 第一、具有极高的美学价值 汉字是世界上最美的文字,从来没有一种文字能像汉字那样给人们带来那么多的美学和艺术享受。书法家通过挥书几个汉字,可以尽情表现胸中的情感和志向,并可以将之传给观赏者。 第二、易读性最好 汉字在实用上的最大优点之一就是容易辨认、容易识读。这就如同辨别一个人一样,如果看到照片,一眼就能认出他来;而若要从一堆身份证号码中找到这个人就很不容易。汉字就如同照片,拼音文字就像身份证号码。汉字阅读起来形象直观,便于联想。拼音文字一句话一般要念到最后才知道它表达什么意思。所以汉字在阅读上要比拼音文字快得多。许多中国才子“一目十行”的读书速度,这在读英文时是绝对不可能做到的。 第三、有利于形象思维 汉字的视觉信息特点有利于人们的形象思维,对提高中华民族的文化智商功不可没。爱因斯坦被公认是伟大天才,而爱因斯坦曾说过,他一向习惯于用图象思考而不是用符号思考。这一点被专家们认定为是他所以成为天才的重要因素。汉字是图象,西文是符号,所以有人说,中国人从小就被训练以图象思考,用图象思考的中国人比用符号思考的西方人天份更高。这话不无道理。 对于汉字在视觉信息方面的优势,也许没有人否认。但恐怕至今还有人认为,汉字的最大缺点是不符合现代信息处理的要求。这正是对汉字的最大误解。恰恰相反,汉字在信息处理方面有着西方文字无法比拟的优势。 汉字在信息处理方面的优势突出地表现在它具有极高的信息处理密度。从现代的角度来看,汉字的这一特点在文字信息处理方面至少有以下三大好处: (1)信息存储空间最省 众所周知,同样内容的材料,用英文写出来所用的字母数量要比用中文写出来所用的汉字数量多得多,大约相差3.4~7.4倍(视文体而定)。尽管汉字的数量庞大、结构繁杂,其字形码需要占用更多的编码空间,字模库也需要更大的存储空间,但这些都是固定的、有限的。而信息处理的文字资料则是无限的。现代计算机操作系统中都用各种语言的统一编码Unicode代码来表示,跟汉字一样,每个英文字母的Unicode代码也都由2个字节﹝2Byte﹞组成,也就是说,在存储时,一个英文字母占用的存储空间跟一个汉字占用的存储空间相同,都是2个字节。所以,相同内容的文字资料,用中文存储所占用的空间只有英文的1/3.4~1/7.4。 (2)处理与传输速度最快 在现代计算机和通讯技术中,文字信息的处理与传输速度是一个非常重要的因素。文字信息处理与传输的对象是它们的Unicode代码,所以文字信息的处理与传输速度与其所含字符数量成反比。既然相同的文字资料中文所含的字符数量要比英文少3.4~7.4倍,中文信息的处理与传输速度就要比英文快3.4~7.4倍。尽管外国人至今故意不去提这一实事。 (3)有利于建立高效率的书写码 英文是码串式文字,它不需要另外编制书写码,组成文字的码串本身就是它的书写码。不过人们并不知道,这种书写码的效率并不高。利用汉字形体所蕴藏的丰富字形信息,可以对中文建立起比英文的书写效率高得多的书写码方案。元根码正是这样一种高效率的中文键盘编码系统,用元根码“书写”中文比英文打字同比快两倍多。 无论从哪个角度来看,汉字决不是一种落后的、不科学的文字。相反,汉字是世界上最具信息化特征的文字,因而,它不仅是世界上最古老的文字,也是世界上最先进、最科学、最具生命力的文字。 第二节 汉字的五种笔画 笔画是组成汉字字形最基本的元素。要想深入认识汉字的字形结构,首先要正确认识汉字的笔画。 什么是笔画?笔画是构成楷书汉字字形的最小连笔单位”(提)这个笔画,总的运笔特点与“一”相同,所以它归为横,这从对照“王”和“?”(王旁)的末笔也可以说明这一点;竖的运笔特点是从上到下,笔画“亅”也归于竖,虽然末端有一个向左的折钩,但不能把它看作折,因为从传统的书写习惯看,汉字的笔画不出现这样的折笔,“亅”末端的折钩应看作是在用毛笔书写“丨”抬笔时自然带出来的,所以“亅”应归于竖;撇的运笔特点是从右上到左下,它包括横撇“”和竖撇“丿”;点的运笔特点是从左上到右下,“捺”()的运笔与点的运笔完全相同,只是长短不同,所以捺属于点;折的特点是运笔方向发生了改变,它包括的笔画形态最多;不过从运笔特点来看,折笔应该再分成横折(先从左至右运笔,然后顺时针拐弯,如:、、乛、 等)和竖折(先从上至下运笔,然后逆时针拐弯,如:、、、ㄥ、ㄑ 等)两类。笔画的分类也是构字部件分类的依据之一,例如,我们可以把“”看作“勹”的变形部件,因为它们的第一笔都是撇,第二笔都是横折;同样可以把“”看作“巳”的变形部件,因为它们的前两笔相同,而末笔都是竖折;但却不能把“”视为“力”的变形部件,虽然这两个部件都是由撇与折相交而成,但前者是撇与竖折相交,而后者是撇与横折相交。另外,有些折笔画,既有顺时针拐弯的部分,又有逆时针拐弯的部分,它们的归类是以开始的拐弯为准,如“乙  ⺄ ?” 等属于横折,“ ” 等属于竖折。 为了编制汉字书写码的需要,我们将“横、竖、撇、点、折”5种笔画分别赋于笔画代号“1、2、3、4、5”。 汉字的笔画分类如表2.1所示。 表2.1 汉字的笔画分类 笔画名称 运笔特点 包 含 的 主 要 笔 画 笔画代号 横 从左到右 一  1 竖 从上到下 丨 亅 2 撇 右上至左下 丿  3 点 左上至右下 丶  4 折 横折 乙    乛  ⺄  ? 5 竖折 乚    ㄥ ㄑ   第三节 字元与字块——汉字的两种组字部件 尽管我们通常都说汉字是由笔画组成的,但是人们在识别汉字时一眼能够看到的是它的组成部件而不是笔画,因为部件具有独立的图形特点,非常直观。如果问,“狠”是由哪些笔画组成的?或者问,“狠”的首笔对是什么,次笔对是什么,未笔对是什么?恐怕很少有人能够立即回答出来。但若要问,“狠”是由哪几个部件组成的,所有认识汉字的人都会马上回答,是由“犭”和“艮”两个部件组成。就是说,人们在识别汉字时,直接看到的是它的部件,而不是笔画。所以我们说,汉字不是直接由笔画组成的,而是由部件组成的,部件才是由笔画组成的。即汉字的构成具有三个层次:笔画→部件→单字。这如同分子构成的三个层次:基本粒子→原子→分子。对汉字来说,能够体现其文化内涵和信息特征的是结构部件而不是笔画。元根码正是根据汉字的这一认知规律和结构原理,利用组字部件建立汉字书写码,使中文信息化书写立足于汉字的文化底蕴,充分发挥它的独特优点,形成直观、易学、高效、实用的性能。 汉字部件是由笔画组成的具有组配汉字功能的构字单位,它一般是由笔画交叉连接而成的相对不变的结构单元,如:长牛身豸艮豕里聿;也有少数基础部件是笔画以离散的关系组合而成的,如:三氵彡小心灬;单笔画也属于基础部件,例如“旦勺札”这三个字,都是由两个部件组成的,它们的第二个部件都是单笔画。 部件又分为非成字部件和成字部件两类。非成字部件本身不是汉字,只能作为汉字的组成部分,如:艹⺧耂忄宀犭辶。成字部件本身是汉字,如:心羊金爪求册氏我。这些单独成字的部件称为独体字。大部分汉字都是由两个以上基本部件像搭积木那样拼合而成的,称为合体字。如:轧范津句回圆。 汉字的部件约有1000多个。对其所含的书写码信息进行深入分析研究后,我们得到一个结论,汉字部件包括两类:字元与字块。字元是可以直接作为汉字的一个书写码信息的汉字部件,是中文书写码的基本码元部件,共有240个。字元一般都有以下两个的特点:(1)直观性好,是人们普遍认知的汉字结构部件;(2)构字能力强,组字频度高。汉字字典中的单部件部首大部分都是字元。 除了字元以外的所有汉字部件都称为字块。字块通常组字频度比较低。从书写码的角度来看,字块都含有两个以上的基本码元信息。 根据信息化书写方法的开发原则,将汉字部件划分为字元与字块,是元根码的理论基础。字元好比元素周期表中的二百多个化学元素,是构成汉字的“原子”;而字块是构成汉字的“原子团”,它是由两个以上的字元连接或交叠而成的汉字部件。字块不能直接作为汉字书写码的码元,在编制汉字书写码时,需要根据某种规则将构成字块中的字元分解出来。 第三章 中文键盘与字元定位 将所有的字元按照一定的原则与计算机标准键盘上键位建立对应关系,然后将汉字的组成部件根据这种对应关系转换成字符串,把这种字符串作为汉字的键盘书写码,这就是元根码的基本原理。构成汉字书写码的全部键位统称为中文键盘。本章将具体说明中文键盘的组成、分区及字元与键位的对应规律。 第一节 规范的中文键盘与编码“特区” 标准键盘中,对应可见字符的键位共有47个,其中包括26个英文字母键和10个数字键,其余11个键为标点符号和其他符号。虽然它们原则上都可以作为中文的书写键,但并不需要、也不可能将所有可见字符键都作为中文的书写键。这里就有一个重要的问题,究竟选择哪些键作为中文书写键更科学、更合理、更规范?从增大中文书写码的编码空间、降低重码的角度来看,键位多一些好。但键位过多有悖人机工程学,反而不利于打字速度的提高。英文书写主要使用的键有30个:26个英文字母键和4个标点符号键。标准键盘将这30个键排成3行,每行10个键,构成英文打字的主键盘,由双手十指分工敲击。英文打字主键盘的这种设计符合人机工程学,不但能将十个手指的功能都发挥出来,而且可以使得打字过程中十指的上下移动的距离最短,有利于降低击键的出错率,最大限度地提高打字速度。所以我们说,规范科学的中文键盘应该与英文打字的主键盘相一致。这样,既能有足够的书写码编码空间,又能使中文打字(包括输入标点符号)完全符合人机工程学,为中文键盘书写的高效性从编码键盘上提供保证。元根码的编码键盘正是这样的一种规范的方案,从而成为信息化的中文键盘。 1、中文键盘的区位划分 中文键盘是由26个英文字母键位组成的,并划分成六部分,分别称为1区、2区、3区、4区、5区和0区;前五个区每区包括五个键,并将每区的五个键分别命以键位号1、2、3、4、5。0区是中文键盘的“编码特区”,特就特在只有一个键,其键位号也是0。特区虽然只有一个键,但它的功能很强大。首先它接纳了其他25个键均不容纳的8个字元,同时它还提供扩展编码功能,从而圆满地解决了特殊符号的信息化书写问题及扩展简码问题,所以特称它为扩展键。中文键盘的区位划分如图3-1所示。 由图3-1可以看出,中文键盘的每一个键对应一个两位数的编号,称为区位号。区位号的十位数字对应该键所在区的区号,个位数字对应该键的位号。扩展键的区位号“00”称为扩展码。中文键盘的这种区位划分实际上是根据指法规律为每一个英文字母定义了一个具有唯一性的2位数字编码。 图3-1 中文键盘的区位划分 2、中文键名 中文键盘中,每个键除了有一个英文字母和一个区位号外,还有一个中文键名,简称键名,如图3-2所示。所有键名都是字元,扩展键的键名是个特殊字元“○”(○是“零”的符号写法,也是一些生僻字的组成部件),既与“特区”的“特”相对应,又与0区的“0”对应。其它键名与区位号之间有如下对应关系: (1) 除“水”外,所有中文键名的首笔的笔画代号均与该键所在区的区号相同; (2) 多数键名的第二笔的笔画代号与该键的位号相同。 例如,“土”的第一笔为“一”(笔画代号为1),第二笔为“丨”(笔画代号为2),所以键名“土”的区位号为“12”;“禾”的第一笔为“丿”(笔画代号为3),第二笔为“一”(笔画代号为1),故键名“禾”的区位号为“31”。 图3-2 中文键名 第二节 字元键位图 将字元与中文键盘上的键位建立对应关系的过程,就是确立字元的键盘信息码过程,也就是将汉字的字形信息转化成书写码信息的过程。元根码的字元与键位的对应关系体现在字元键位图上。 1、字元总表与字元键位图 字元及其与键位的对应关系见“元根码字元键位图”,图中包括了200个基本字元和40个非基本字元。基本字元为主体字元,是汉字的主要组成部件,非基本字元与基本字元同源或形态相似。还有一类字元叫做变形字元,变形字元不是独立字元,在字元表中一般不标出,可参见表3.2的“变形字元”一栏。变形字元有三种:第一是成字字元作为偏旁部首时,它的某些笔画发生了变形或者进行了简化,例如“爪”当作为部首时变为“爫”,“食”作为偏旁时简化为“饣”;类似的例子还有:竹→⺮、牛→牜、西→覀、羊→⺶、雨→、足→⻊、示→礻、衣→衤、手→、艮→、金→钅、言→讠、月→、四→罒;第二是字元在组字时因在字中所处的部位不同而产生了笔画变形或比例变化,如“木”出现在底部时变形为“朩”,“巳”与“七”组成“民”时,“巳”变为“”,“七”变为“”,“心”作为恭、慕等字的末部件变形为“⺗”,等等;第三是与“长贝门车鱼马纟”等字元相对应的繁体部件“長貝門車魚馬糹”等也视为变形字元。变形字元虽然不是独立的字元,但在字元判断与字块分解时要注意识别。 字元键位图乍看起来好象一堆杂乱无章的汉字部首。实际上,它们的分布是有一定的规律的,掌握了这个规律,学习和记忆起来就会很容易。 字元分布的基本规律是: (1)大部分字元的首笔笔画代号与次笔笔画代号的连写等于区位号。例如: 土士十寸雨:首笔为横,次笔为竖,故在12(F)键上; 山由贝曲冂:首笔为竖,次笔为折,故在25(M)键上; 禾攵竹毛:首笔为撇,次笔为横,故在31(T)键上; 已己尸:首笔为折,次笔为横,故在51(N)键上; 幺纟彑母:首笔与次笔均为折笔,故在55(X)键上。 (2)单笔字元与同笔字元,其笔画代号与笔画个数的连写等于区位号。 所谓“单笔字元”,是指仅含一个笔画的字元;所谓“同笔字元”,是指由同一种笔画以离散的关系组成的字元。它们的分布规律由表3.1示出。 表3.1 单笔字元与同笔字元的分布 位 区 1 2 3 4 5 1(横) 一 二 三 2(竖) 丨 〢 3(撇) 丿  彡 4(点) 丶 冫 氵 灬 5(折) 乙 巜 巛 元根码字元键位图 11.G 王青头戋五一 21.H 目具食卜虎无几 31.T 禾毛竹撇双人立 41.Y 言文方广鹿丢比 51.N 已巳己叚官鼠底 12.F 土甫十寸未干雨 22.J 日早立刀与虫依 反文条头夜下里 亩首高头隹人离 左框折尸??心羽 13.D 大三戊长古石厂 23.K 口卅川 面框里 32.R 白手气头丘舞斤 42.U 立辛两点六门病 52.B 子皮耳也框向上 14.S 木丁西缺脚其 24.L 田甲方框四车力 33.E 月爪告头豕表底 妆妝左旁首自去 53.V 女走九臼山朝西 15.A 工臣草头右框七 犬旁寄 25.M 山由贝曲下框几 34.W 人登头 盥去里 43.I 水兴头 小倒立 54.C 又巴厶 牛马寄 35.Q 金鸟缺爪有尾鱼 44.O 火业空头兆革米 55.X 幺母贯头弓艮匕 互无一 乂儿勹夕氏无七 45.P 之宝盖建示衣 00.Z ○羊舟身夫酉足 表3.2 元根码字元总表 分区 区位 键位 基本字元(200) 非基本字元(40) 变形字元 0 00 Z ○羊舟身夫酉足耂 ⺶⻊ 1 11 G 王一戋五  ? 12 F 土二十寸雨干未 士  13 D 大三厂石戊古长 丆镸 長 14 S 木 丁西 朩覀 15 A 工匚七戈弋臣艹廿犭 廾 卄 2 21 H 目丨卜上止虍食 卝 饣飠 22 J 日刂虫早 曰 〢 23 K 口川卅   24 L 田 甲囗四皿车力  罒車 25 M 山冂由贝曲几 貝冎 3 31 T 禾丿竹毛攵夂彳  ⺮ 32 R 白丘⺁斤手扌  33 E 月彡爪乃豸⺧豕用  ?爫 34 W 人八亻癶  35 Q 金勹儿夕鱼乂 ⺈ 钅魚 4 41 Y 言丶亠文方广 讠 42 U 立冫门丬疒丷辛六 爿 門 43 I 水氵小  氺⺌ 44 O 火灬穴米兆业革   45 P 之冖示衣辶廴宀  礻衤 5 51 N 已乙尸心羽忄 己巳⺗ 乚 52 B 子巜凵了也皮阝卩耳 孑⺋  53 V 女巛刀九臼彐走   54 C 又厶巴马牛  牜馬 55 X 幺纟母彑艮匕弓 毋 糹 (3)有些字元,它的前两笔并不符合上面两条分布规则,但它们与其所在键的键名或主要字元在含意上是相同的,在古汉字中本是同一个字,只是在汉字演变中发生变形而已。所以它们在同一个键上。如: 扌(手) 亻(人) (米) 爿(丬) 忄(心) 耳(阝) (4)有些字元,其分布不符合上述规则,但它的形态与其所在键上的某个字元相近。如: () 古(石) 夂(攵) (干) 廴(辶) (刀) (5)42(U)键上的字元除“门”外都有两点,44(O)键上的字元大多都有四个点。如: 冫 立 辛 丬  疒 (42键上的字元) 灬 米 兆   (44键上的字元) (6)00(Z)键上的字元“舟、足、耂(者头)”可借助其声母的第一个字母等于“Z”来记忆。 (7)个别字元的分布无规则可循,需特别记住。如: 未  彳 ⺧ 羽 彐 巴 艮 (次笔与位号不一致) 犭 长 食 车 力 革 心 牛 (首笔次笔与区号位号均不一致) 以上七条,第一、第二是最基本、最主要的分布规律,根据这两条规律就可以掌握多数字元的基本分布情况。后五条可以帮助我们进一步掌握所有字元的分布情况。 给定一个字元,根据上述分布规律,即可知道它在哪个键上。例如: :首笔为横(代号1),次笔为竖(代号2),故“”在12键(F)上; 穴:首笔为点(代号4),次笔为点(代号4),故“穴”在44键(O)上; 曲:首笔为竖(代号2),次笔为折(代号5),故“曲”在25键(M)上; 巛:为同笔字元,笔画代号5,笔画个数3,故“巛”在53键(V)上; 兆:有四个点,故在44键(O)上。 2、字元助记词 牢记字元在键盘上的分布是学好元根码的关键。为了帮助初学者记忆,我们把字元的分布编成“助记词”,即将每个区的主要字元按键位顺序编成歌谣,每区一首,使枯燥无味的字元读起来琅琅上口。在掌握字元分布规律的基础上,熟诵助记词,会使你很快地掌握字元的区位分布。 第一区助记词 11 王青头戋五一 (“”读“囊”,“青头”指“”) 12 土十寸未干雨 (“”读“甫”) 13 大三戊长古石厂 14 木丁西缺脚其 (“”读“邦”,“缺脚其”指“”) 15 工臣草头右框七 (“右框”即“匚”) 犬旁寄 (“犬旁”即“犭”) 第二区助记词 21 目食卜虎无几 (“”读“具”,“虎无几”指“虍”) 22 日早立刀与虫依 (“立刀”指“刂”) 23 口卅川 面框里 (“面框里”指“”) 24 田甲方框四车力 (“方框”即“囗”) 25 山由贝曲下框几 (“下框”即“冂”) 第三区助记词 31 禾毛竹撇双人立 (“双人立”即 双立人“彳”) 反文条头夜下里 (“反文条头夜下里”指“攵”、“夂”和“”) 32 白手气头丘斤 (“气头”指“”,“”读“舞”) 33 月爪告头豕表底 (“告头”指“⺧”,“表底”指“”) 34 人登头 盥去里 (“登头”指“癶”,“盥去里”指“”) 35 金鸟缺爪有尾鱼 (“鸟缺爪”指“”,“有尾鱼”即“鱼”) 乂儿勹夕氏无七 (“乂”读yì,“勹”读“包”,“氏”去掉七即“”) 第四区助记词 41 言文方广鹿丢比 (“鹿丢比”为“”) 亩首高头隹人离 (“亩首高头”指“亠”和“”,“隹人离”指“”) 42 立辛两点六门疒 (“疒”读“病”) 妆妝左旁首自去 (“妆妝左旁”指“丬爿”,“首”去掉“自”为“”) 43 水兴头 小倒立 (“兴头”指“”,“小倒立”指“小”和“⺌”) 44 火业空头兆革米 (“空头”指“穴”) 45 之宝盖廴示衣 (“廴”读“建”) 第五区助记词 51 已巳己官鼠底 (“”读“暇”,“官鼠底”指“”和“”) 左框折尸心羽 (“左框”即“”,“”读“眉”) 52 子皮耳也框向上 (“框向上”即“凵”) 53 女走九臼山朝西 (“山朝西”指“彐”) 54 又巴厶 牛马寄 (“厶”读sī) 55 幺母贯头弓艮匕 (“贯头”指“”,“艮”读gèn) 互无一 (“互无一”为“彑”) 第○区助记词 00 ○羊舟身夫酉足 一个字元所在键的区位号称为该字元的字元码。例如“长”的字元码是“13”,“曲”的字元码是“25”。一个字元的字元码也可以用它所在键的英文字母表示,如:“长”的字元码可看作“d”、“曲”的字元码可看作“m”。字元码是组成中文书写码的基本码元。 第三节 字元组字实例 这一节我们通过下面的字元组字示例,进一步加深对字元的认识。 11·G:王 一 戋 五    现 旦 线·F:土 二 十 寸 雨  干 未 士    地 仁 协 过 雪 辅 汗 味 志 半 判 幵 13·D:大 三 厂 石 戊 古 丆  长 镸 夺 叁 厅 矿 茂 估 页 左 张 肆 14·S:木 丁 西   村 可 要 其 寿 15·A:工 匚 七 戈 艹 犭 臣 弋  廿  廾   功 匠 切 划 芳 犯 卧 代 尧 燕 共 卉 寒 舛 21·H:目 丨  上 止 卝 虍  食 卜  睛 旧 卢 让 此 芈 虑 直 饥 外 疋 22·J:日 刂 早 虫 〢   曰   明 则 草 蚊 坚 师 齐 冒 临 衰 23·K:口 川   呈 顺 带 面 24·L:田 囗 四 车 力 甲 皿  思 因 泗 轮 加 钾 益 曾 25·M:山 冂 由 贝 曲  几 崭 同 邮 财 蛐 骨 凡 31·T:禾 丿  竹 毛 攵 彳  夂  和 失 每 答 笔 放 行 监 条 夜 32·R:白  丘 ⺁ 斤 手   扌  的 勿 兵 反 欣 拿 气 看 打 舞 33·E:月 彡 爪 乃 豸 ⺧ 豕    用   服 杉 采 孕 豹 先 逐 表 青 炙 甬 象 畏 34·W:人 癶  亻 八   从 癸 段 他 公 舆 飞 35·Q:金 勹 儿  夕 鱼  乂 钅 ??  鉴 勾 允 氏 多 鲁 岛 爻 针 久 荒 41·Y:言 丶 亠 文 方 广 讠    信 勺 亩 刘 芳 庆 让 享 鹿 难 42·U:立 门 疒 冫 丷 辛 六 丬  爿 音 闪 疤 冷 总 辨 交 状 前 奘 43·I:水 小  氵 氺   ⺌  冰 少 学 泊 泰 承 脊 肖 步 44·O:火 穴 米 兆 业 革 灬    灯 究 类 桃 邺 靳 杰 亦 敝 鬯 45·P:之 冖 示 衣 辶 廴 宀  芝 军 社 补 边 延 字 冡 51·N:乙  尸   心 羽 己 巳  忄 ⺗  艺 巨 展 假 官 沁 扇 记 导 眉 怕 恭 鼠 52·B:子 卩 凵 了 也 皮 巜 孑 阝 耳 ⺋ 李 节 凶 辽 地 彼 粼 孙 队 取 仓 53·V:女 巛 刀  九 臼 彐   走 姑 巡 分 发 杂 舅 录 那 隶 赴 54·C:又 厶 巴 马 牛     圣 台 肥 驰 牺 予 劲 祭 以 55·X:幺 纟 母 艮 彑 匕 弓   毋  幻 红 每 良 互 它 引 丝 贯 毐 即 00·Z:○ 羊 舟 身 夫 酉 足 耂 ○ 差 船 射 规 酒 跟 者 第四节 必不可少的中文键盘指法训练 信息化书写方式的“写字”过程,就是将一眼能够看到的汉字字元变为手指对字元键位的快速敲打过程。所以,信息化书写方式对“书写”者的基本要求,就是要通过指法训练,建立起手指对字元键位的条件反射。因此,拿出几天时间,认认真真地对字元键盘作一番强化性训练,是掌握信息化书写方式必须要过的一关。西方人在打字之前不是也要过这样一关吗?西方国家一百多年来引以自豪的“键盘书写文化”,就是通过他们对英文键盘指法的强化训练建立起来的。 通过强化训练,形成手指对字元键位的条件反射,才能为中文的信息化书写创造指法条件。这和英文键盘的指法练习的道理是一样的。当然,字元的数量比英文字母多一些,相比练习的时间要长一些。不过,由于字元分布有一定的规律性,再加上助记词帮助记忆,中文键盘的指法训练也不比英文键盘指法训练难多少。从元根码的培训经验来看,无论年龄大小,只要借助于元根码教学软件认真训练,一般经过两周的时间,都可以很好地掌握。中文键盘指法的强化训练,是一项建立“民族键盘书写文化”的工作。 第四章 汉字的结构分类与字块分解 下面两个字都是由四个字元组成的,相应的四个字元码标在其后的括号中: 躇:⻊艹耂日(zazj) 襟:衤木木示(pssp) 在元根码状态下,只要依次键入括号中的四个字元码,这两个字就会出现在编辑位置。这种能实现汉字键书的一组字元码叫做“汉字书写码”。书写码的组成单元称为码元。 组成书写码的码元主要是汉字的字元,它是汉字书写码的主体码元。字块都是两个以上的字元交叉连接而成的汉字部件,所以字块都包含两个以上的字元。如:“内”是由字元“冂”和字元“人”相交而成的字块,“更”是由“一 曰 乂”三个字元交叉连接而成的字块。在进行汉字书写码的编码时,必须将组成字块的几个字元分解出来,以便确定它包含哪几个字元。我们将字块中的字元判断出来的过程叫做字块分解。换句话说,字块分解是根据其笔画结构判定字块中所含字元的方法。 元根码提供的字块分解方法通过字块分解流程图体现出来,这是一种建立在汉字结构分类基础上,根据字块的笔画组成特点对其组成字元进行界定的方法。它不仅符合人们对字块结构的直观认识,而且规范严谨,简单明了,非常容易学习和掌握。 第一节 汉字的结构分类 汉字从组字部件的角度可分成独体字与合体字两大类。仅含一个部件的字称为独体字,如:舟、革、失、聿;由2个以上部件组合而成的字称为合体字,如:独、体、特、圆。 独体字又可以分成单元字与单体字两类。如果独体字是一个字元,则称它为单元字;成字字元都是单元字,如:皮、身、酉、夫、未;如果独体字是一个字块,则我们称它为单体字;成字字块都是单体字,如:天、朱、本、夹、末。 根据部件在字中的相互位置关系的不同,合体字分为以下四种结构类型: 左右结构——部件之间是左右位置关系。如: 样狠牿秘湘衍裸 上下结构——部件之间是上下位置关系。如: 字符尧舍意誓磊 半包围结构——部件之间是一个部件半包围其它部件的关系。如: 岛(山) 闭(门才) 肩(户月) 厕(厂则) 全包围结构——一个部件将其余部件完全包围。如: 因(囗大) 回(囗口) 圆(囗员) 囱(夂) 合体字的部件是以离散的关系(即部件之间没有笔画交连)组合在一起的,很容易与独体字相区分。 汉字的结构分类如下图所示。 汉字还可以分为单元字和复元字两类。单元字即成字字元,单体字与合体字都是复元字。而复元字又可以根据其中所含的字元数分为:“双元字”(含两个字元的复元字), “三元字”(含三个字元的复元字), “多元字”(含四个以上字元的复元字)。如: 茂 告 狠 酒 跟 者(双元字) 海 哪 撇 馆 趣 船(三元字) 福 假 赠 澡 躏 逾(多元字) 第二节 字块分解方法 字块分解的主要困难是它的“二异性”,即一个字块有可能被看作有多种分解结果。例如:“百”应该分解成“一白”呢,还是分解成“丆日”呢? “午”究竟应该分解成“丿干”呢,还是分解成“十”呢,或是分解成“丨”?元根码提供的字块分解方法——结构特点判断法,可以避免这种二异性,迅速得出正确的分解结果。这种分解方法体现在22页的字块分解流程图中。所谓分解流程图,是字块分解方法步骤的图形表示,其特点是形象直观。现以下面18个单体字为例来具体说明字块分解的方法: 天 缶 聿 年 午 失 半 朱 生 重 百 且 舌 亡 朿 我 酋 互 根据流程图,字块的分解步骤如下: 第一、首先看要分解的字块是否具有以下结构特点(第一结构特点):首笔与次笔可构成一个字元,其余部分也是一个字元,且这两个字元成连接结构。如果具有这样的特点,则前两笔分解为第一字元,剩余的部分为第二字元。例如,上面18个例字中,有以下5个汉字合这一结构特点,其分解结果如下: 午:十 半:丷 百:丆日 亡:亠 酋:丷酉 第二、如果要分解的字块不具备第一结构特点,再看它是否具有第二结构特点:首笔与其它笔画相连而不相交,且去掉首笔后剩余的部分是一个字元。若具有这个特点,就将首笔分解为第一字元,剩余部分作为第二字元。上面剩余13个字中,有以下5个汉字合这个特点,分解如下: 天:一大 失:丿夫 朱:丿未 舌:丿古 互:一彑 剩下的8个例字既不具备第一结构特点,也不具备第二结构特点。例如“且”,虽然其前两笔“冂”和其余部分“三”都是字元,但这两个字元不是以连接关系组成“且”,而是以迭合关系组成“且”,所以它并不具备第一结构特点。至于第二结构特点,显然它更不具备。 第三、一个字块如果上述两个特点均不具备,则按顺笔取大原则进行分解。 所谓顺笔取大,意思是,按照笔画的书写顺序,从第一笔开始取尽可能大的字元(即笔画尽可能多的字元)作为分解的第一个字元,剩下的部分如果是字元,它就是分解的第二个字元;如果剩下的部分不是字元,仍按笔画的书写顺序取尽可能大的字元作为分解的第二字元;照此原则依次进行,直至分解完为止。在这里不再顾及分解出的字元在字中是不是交叠,而强调“取大”。如:“缶”字,既不具有第一结构特点,也不具备第二结构特点,应按顺笔取大原则进行分解,它按笔顺写下的第一个尽可能大的字元是“”,即“缶”应分解成“山”,若分解成“丿干凵”或分解成“十凵”都是不正确的。又如,“且”的前两笔虽然可构成一个字元,但不是最大的,而其前四笔“”却是一个字元,故“且”分解的第一个最大的字元应是“”,即“且”应分解成“一”,若分解成“冂三”就不符合顺笔取大的原则。再如,“生”也是既不具备第一结构特点,也不具备第二结构特点(注意:生去掉首笔后剩余的部分不能视为青头!),所以“生”只能按顺笔取大的原则分解为“牛一”。下面是按此原则分解的另外5个例字: 聿: 年:丨十 重:丿車一 朿:一冂小 我:丿扌乚丿丶 字块的上述分解步骤可简记为以下三句话: 一看前二笔, 二看第一笔, 三是顺笔取大的。 注:以下10个字块特殊分解为: 不:一小 无:二儿 夹:夫丷 堇:革二 万:丆 主:丶王 兀:一儿 末:一木 :三人 束:一口小 合体字中如含字块,对其字块也要照此方法分解。为判断方便,首先将其中离散的字元分出来,然后将剩下的字块进行分解,最后将所有字元按它们的首笔画的书写顺序排序即得分解结果。例如,“哉”分解时,先将“口”分出,再将剩下的“”分解得“十、戈”,最后将这三个字元按它们的首笔画的书写顺序排序便得分解结果:十、戈、口。下面是另外4个合体字的分解实例: 伞:人丷十 戚:戊上小 臧:戊乚丆臣 囱:丿囗夂 第三节 字块分解举例 字块分解是以笔画书写顺序为基础的,所以,要想得到正确分解结果,必须要注意书写笔顺的规范性。除此以外,再注意以下两点,字块的分解方法就会很快掌握。 (1)注意变形字元的识别。我们在第三章第二节的一开始就已经提到三种变形字元的概念。在进行分解时,要特别注意的是有些末笔为折的笔画组合,无论其形态如何,只要与之交连的笔画与某个字元相同,交连的位置也相同,均可作为该字元的认同字元。 例如:→冂,⺈→勹,→七,→巳,→己,→ 周(冂土口) 久(勹) 尔(勹小) 切(七刀) 东(七小) 民(巳七) 改(己攵) 乐(小) 下面四个笔画组合也是变形字元的例子:→了,→,→彐,→曲 予(了) 侯(亻大) 录(彐水) 典(曲八) (2)有几个半包围结构的合体字,不要误认为是单体字。如: 成(戊) 戌(戊一) 戎(戈) 戒(戈廾) 戉(戈乚) 初学者只要对下面汉字做一下分解练习,就会很快掌握分解技术并熟练运用。 主:丶王 堇:革二 朿:一冂小 办:力八 卑:白丿十 秉:丿一小 不:一小 才:十丿 卸:止卩 臧:戊乚丆臣 承:了三 丑:乙土 出:凵山 殷:⺁彐几又 春:三人日 匆:勹丶 丹:冂亠 单:丷日十 丢:丿土厶 东:七小 而:丆冂〢 发:又丶 非:丨三丨三 祭:示 甘:艹二 中:口丨 更:一曰乂 瓜:⺁厶 龟:勹曰乚 鬼:白儿厶 果:日木 亥:亠乚丿人 乎:丿丷十 击:凵 及:乃 夹:夫丷 兼: 柬:一小 井:二 巨:匚 考:耂一乚 乐:小 离:文凵冂厶 吏:一口乂 两:一冂人人 率:亠幺十 矛:了丿 免:勹口儿 民:巳七 半:丷 南:十冂十 年:丨十 失:丿夫 片:丿丨一乙 且:一 求:丶 肉:冂人人 入:丿 旅:方 甚:八乚 史:口乂 首:丿目 书:乙乙丨丶 幽:山幺幺 束:一口小 肃:丨八 凹:丨乙丨乙一 里:日土 瓦:一乚乙丶 万:丆乙 韦:二乙丨 为:丶力丶 我:丿扌乚丿丶 乌:丿乙乚一 无:二儿 象:勹口 牙:匚丨丿 焉:一止一乚灬 央:冂大 永:丶乙 沈:氵冖儿 与:一乚一 禹:丿口冂丨一丶 乍:丨二 丈:  争:勹丨 重:丿車一 州:丶丿丶卜丨 朱:丿未 蒙:艹豕 燕:廿口丬匕灬 专:二乚丶 丐:一乚 丞:了一 禺:日冂丨一丶 芈:丨一 凸:丨一丨乙一 奘:爿士大 曷:曰勹人乚 爰:爫又 聿: 蚩:凵丨一虫 缶:山 臾:臼人 尤:乚丶 拜:三十 班:王丶丿王 丰:三丨 报:扌卩又 扁:丶尸冂艹 曹:一曲日 插:扌丿十臼 辰:厂二 囱:丿囗夂 得:彳日一寸 釜:八乂干 哥:丁口丁口 寡:宀丆一八刀 贵:口丨一贝 惠:一曰丨一丶心 棘:一冂小一冂小 脊:人月 捷:扌一 聚:耳又亻 兰:二 丽:一冂丶冂丶 练:纟七乙八 隆:阝夂一牛一 卤:囗乂 卵:丶丿卩丶 壹:士口 笫:⺮丿乚丨丿 沛:氵一冂丨 酋:丷酉 伞:人丷十 衰:亠 所:⺁斤 畏:田一 延:丿廴 养:⺶ 彝:彑米幺小廾 寅:宀一由八 印:一卩 庸:广月丨 盥:水皿 舆:车一八 御:彳止卩 寓:宀曰冂丨一丶 噩:王口口口口 囟:丿囗乂 面:丆冂一 虎:虍几 叟:臼丨又 戢:口耳乚丿丶 兜:白儿 沔:氵一丨乚乙 越:走戈乚 来:一米 判:丷刂 唐:广彐丨口 逆:凵丿辶 册:冂冂一 屯:一凵乚 弟:丷弓丨丿 枣:一冂小 串:口口丨 疟:疒匚一 妻:一彐丨女 庚:广彐人 再:一冂土 事:一口彐丨 农:冖 甩:月乚 乜:乚 羲:丷王禾一乚乚丿丶 君:彐丿口 囊:冖口口 黑:土灬 既:艮匚儿 熏:丿一土灬 第五章 汉字的三种字型与键盘编码 汉字书写码的确定方法称为键盘编码。汉字主要是根据字元进行编码的,但有一部分汉字在编码时还需要增加辅助信息码。辅助信息码主要有笔画码和识别码。笔画码是单元字编码时所需的附加信息码。单元字的某一个笔画看作单笔字元时,该单笔字元的字元码就称为这个笔画的笔画码。以“曲”为例,其首笔画为“丨”,相应的单笔字元的字元码为h,故它的首笔画的笔画码为h;而其次笔为“”,相应的字元码为n,故曲的次笔笔画码为n;未笔为“一”,笔画码为g。至于什么是识别码,将在本章的第二节中说明。 第一节 汉字的三种字型 汉字是由部件在二维方向上构成的平面文字,同样的几个部件,同样的书写顺序,摆放的位置不同,就构成不同的字。如: 吧——邑 岂——屺 呐——呙 可见,部件的位置关系,也是区分汉字的重要特征信息,这种特征信息称为字型。 根据构成汉字各部件之间位置关系的特点,复元字可分为三种字型:左右型、上下型、杂合型,并分别命以字型代号1、2、3。具体说明如下: 1型汉字 1型汉字即左右型汉字。它主要是那些左右结构的合体字。如: 私 利 惊 酒 判 湘 彻 2型汉字 2型汉字即上下型汉字。上下结构的合体字都是2型字。由两个字元上下连接而成的单体字也被视为2型字。如: 冬 誓 聂 等 荤 豪 意 去 卞 太 灭 亏 户 3型汉字 3型汉字即杂合型汉字,它包括:包围结构的合体字及字元交迭而成的单体字;另外,首字元为撇的上下型单体字在键盘编码时也被视为3型字。如: 头 连 戒 厄 匡 彦 回 农 里 甘 血 乎 第二节 识别码 下面是三个双元字根据其字元构成的书写码: 酒:氵酉/43 00 洋:氵羊/43 00 浞:氵足/43 00 这三个字尽管第二个字元不同,但字元码相同,因而它们的字元码序列是相同的。把这样的字元码序列作为这三个字的书写码,计算机就会搞不清楚你要的是哪个字。因此,这三个字编码时,需要增加一个区分它们的信息码。 这个信息码应该是什么呢?不难看出,这三个字的一个典型区别是它们的第二个字元(末字元)的最后一笔的笔画不同。“酉”的末笔是横,“洋”的末笔是竖,“足”的末笔是捺。如果在上述字元码序列的后边加上它们的末笔的笔画代号就可以把它们区分开了: 酒:43 00 1 洋:43 00 2 浞:43 00 4 但是,有些汉字即使增加末笔的笔画代号也无济于事。例如: 叭:口八,末笔为丶,编码23 34 4 只:口八,末笔为丶,编码23 34 4 这两个字由于所包含的字元完全相同,字元的书写顺序也完全相同,所以末笔笔画代号也是相同的。显然这两个字的区别是字型不同。如果在它们的末笔代号后再增加一个字型代号,使它与末笔代号构成一个两位数编码,就可以区分开了。 叭:23 34 41 只:23 34 42 这个由末笔代号和字型代号组成的两位数编码,当它作为区位号看待时,便称为末笔字型交叉识别码,简称识别码。跟字元码一样,识别码也可以用字母表示,例如上例的两个字的识别码可以分别表示为y 和u,它们的书写码可写成: 叭:kwy 只:kwu 不难看出,对于1型字,识别码等于末字元的末笔作为单笔字元的字元码;对于2型字,识别码等于2个末笔画组成的同笔字元的字元码;对于3型字, 识别码等于3个末笔画组成的同笔字元的字元码。例如: 1型字 蛐:虫 曲 一 (“一”为末笔,“一”的字元码即为识别码) 汀:氵 丁 丨 (“丨”为末笔,“丨”的字元码即为识别码) 衫:衤 彡 丿 (“丿”为末笔,“丿”的字元码即为识别码) 铍:钅 皮  (“”为末笔,“”的字元码即为识别码) 饥:饣 几 乙 (“乙”为末笔,“乙”的字元码即为识别码) 2型字 盘:舟 皿 二 (“一”为末笔,“二”的字元码即为识别码) 岳:丘 山 〢 (“丨”为末笔,“〢”的字元码即为识别码) 户:丶 尸  (“丿”为末笔,“”的字元码即为识别码) 芙:艹 夫  (“丶”为末笔,“”的字元码即为识别码) 究:穴 九 巜 (“乙”为末笔,“巜”的字元码即为识别码) 3型字 戌:戊 一 三 (“一”为末笔,“三”的字元码即为识别码) 痒:疒 羊 川 (“丨”为末笔,“川”的字元码即为识别码) 尹:彐 丿 彡 (“丿”为末笔,“彡”的字元码即为识别码) 虑:虍 心 氵 (“丶”为末笔,“氵”的字元码即为识别码) 爬:爪 巴 巛 (“乙”为末笔,“巛”的字元码即为识别码) 笔画代号有五种,字型代号有三种,所以识别码共有5×3=15种。如下表5.1所示。 表5.1 汉字的十五种识别码 字 型 1 2 3 横 1 11 g 一 12 f 二 13 d 三 竖 2 21 h 丨 22 j 〢 23 k 川 撇 3 31 t 丿 32 r  33 e 彡 点 4 41 y 丶 42 u  43 i 氵 折 5 51 n 乙 52 b 巜 53 v 巛 表中识别码有三种表示形式,无论哪种形式,在书写时敲的都是同一个键。 对于识别码还需要说明以下三点: (1) 末笔字型交叉识别码中的末笔是指字块分解后末字元的末笔,而不是该字的末笔,这两者是有区别的。有些字的末笔笔画并不等于末字元的末笔笔画。例如: 困:字的末笔是“一”,末字元(木)的末笔是“丶”。 哉:字的末笔是“丶”,末字元(口)的末笔是“一”。 (2) 对于以“辶”或“廴”为末字元组成的杂合型双元字或三元字,为了避免识别码失效,特殊规定要取次末字元的末笔来识别。例如: 近:次末字元是“斤”,识别码为“23”,编码为“32 45 23” 迫:次末字元是“白”,识别码为“13”,编码为“32 45 13” 这两个字若以末字元的末笔来识别,则识别码均为“43”,书写码完全相同,就无法区分了。 但应注意,对于以“辶”或“廴”为末字元组成的1型字或2型字,仍取末字元的末笔来识别。例如: 涟:识别码为“41” 莲:识别码为“42” (3) 鉴于“力 乃 刀 九 匕 方”这6个字元的未笔究竟是撇还是折,人们往往容易误判,所以元根码规定,当它们作为末字元需要识别时,一律用折笔来识别码。例如:“勒 绣 初 仇 牝 仿”这6个字的识别码均可为“51”,“夯 艿 分 究 仑 芳”的识别码均可为“52”。用折笔来识别它们,既直观,又可省去对笔顺的判断。 第三节 汉字键盘编码规则 汉字的键盘编码规则可以用下面的编码歌来概括: 汉字书写信息化,依照笔顺来取码; 键名重复打四下,单元增加笔画码; 复元汉字先分解,一二三末字元码; 字元个数小于四,后边补一识别码。 这首编码歌指出了汉字键盘编码的以下四条基本原则: (1)按书写顺序取码的原则; (2)一个字的书写码最多为四码的原则; (3)以字元码为主,笔画码和识别码作为补充的编码原则; (4)键名字、单元字、复元字编码规则不同的原则。 1、键名的编码规则 键名的编码最简单,即将键名的字元码重复取四次即可。这就是编码歌中所说的“键名重复打四下”的含意。例如: 土:12 12 12 12 /ffff 口:23 23 23 23 /kkkk 金:35 35 35 35 /qqqq 幺:55 55 55 55 /xxxx 2、单元字的编码规则 除了键名外,其余单元字的编码规则是:第一码为本身的字元码,后三码由它的首笔笔画码、次笔笔画码和末笔笔画码组成。具体编码又分三种情况: (1)笔画在三笔以上的单元字,其编码是: 字元码+首笔笔画码+次笔笔画码+末笔笔画码 例如: 戊:戊 一 丿 丶 13 11 31 41 /dgty 羊:羊 丶 丿 丨 00 41 31 21 /zyyh 曲:曲 丨  一 25 21 51 11 /mhng 臣:臣 一 丨  15 11 21 51 /aghn 业:业 丨 丨 一 44 21 21 11 /ohhg 身:身 丿 丨 丿 00 31 21 31 /ztht 毛:毛 丿 一 乚 31 31 11 51 /ttgn (2)笔画为两笔的单元字,编码是: 字元码+首笔笔画码+末笔笔画码 例如: 力:力  丿 24 51 31 /lnt 乃:乃 ?? 丿 33 51 31 /ent 匕:匕 丿 乚 55 31 51 /xtn 九:九 丿 ⺄ 53 31 51 /vtn 刀:刀  丿 53 51 31 /vnt (3)单笔画字的编码是由字元码、笔画码、外加一个补助码共3个码组成。补助码为“L”或“Z”,横、竖、撇、点和竖折的补助码均为“L”,横折的补助码是“Z”。如: 一:11 11 24 /ggl 丨:21 21 24 /hhl 丿:31 31 24 /ttl 丶:41 41 24 /yyl 乚:51 51 24 /nnl (乚与L形态相似,故用L作补助码) 乙:51 51 00 /nnz (乙与Z形态相似,故用Z作补助码) :51 51 00 /nnz 乛:51 51 00 /nnz ⺄:51 51 00 /nnz 3、复元字的编码规则 编码歌的后四句已经将复元字的编码规则说明白了,这就是:首先将其中的字块分解成几个字元码,然后取其第一、二、三、末共四个字元码组成书写码。如果字元码不足四个,则在后边补一个识别码。这个规则可用下面的公式表示: 第一字元码+第二字元码+第三字元码+末字元码 (多元字) 第一字元码+第二字元码+第三字元码+识别码 (三元字) 第一字元码+第二字元码+识别码 (双元字) 例如: 耀:⺌ 一 儿  43 11 35 41 /igqy 衡:彳 ⺈ 田 丨 31 35 24 21 /tqlh 兴: 一 八 冫 43 11 34 42 /igwu 奎:大 土 土 二 13 12 12 12 /dfff 洋:氵 羊 丨 43 00 21 /izh 灭:一 火 冫 11 44 42 /gou 甫: 丶 氵 12 41 43 /fyi 血:丿 皿 三 31 24 13 /tld 爬:爪 巴 巛 33 54 53 /ecv 由上述的键盘编码规则可知,汉字的书写码最长四码。不足四码的汉字,要在敲入它的书写码后加敲一个空格键,表示书写码到此为止。 第四节 繁体字的编码 用元根码可以书写繁体字。繁体字的编码规则与简体字完全相同,会书写简体字就会书写繁体字。只是在对繁体字进行编码时,要注意识别以下10个认同字元: 長 飠  車 貝  魚 門 馬 糹 “长、饣、、车、贝、、鱼、门、马、纟”这10个字元,是由“長、飠、、車、貝、、魚、門、馬、糹”这10个繁体部件简化而来的,所以这10个繁体部件都是相应的认同字元。另外,还要把繁体字的另一个组字部件“冎”看作“”的认同字元。这样,一共有11个繁体部件是编码时的认同字元,其相应的字元码分别是: 長 d 飠 h  k 車 l 貝 m  q 魚 q 門 u 馬 c 糹 x 冎 m 例如,下面几个繁体字的编码分别应是: 張xdy 餞haay 帶kpmh 輪lwga 賓pgim 驢chll 練xgli 禍pmkg 闖uci 鳥qoi 同样,对“長、車、貝、魚、門、馬”这6个繁体字编码时,要把它们看作单元字,按单元字的编码规则进行编码: 長dghy 車lghh 貝mhny 魚qtny 門uhng 馬cghy 元根码的键盘编码规则简单易学,只要熟练地掌握字块分解方法,编码就是一件很容易的事情。下面是汉字编码举例。 人:八:wty 入:tyi 乙:nnz 编:xyna 恭:awnu 严:gotr 年:rhfk 丸:vyi 椽:sxey 先:eqb 面:dmkg 义:yqi 食:htyy 垂:tghg 片:thgn 于:gfj 亡:ynb 尤:dnyi 万:dnv 无:fqv 左:dad 宦:pab 善:zukf 元:fqb 毛:ttgn 世:anv 身:ztht 长:dtgy 永:ynii 切:avn 越:vanv 州:ytyh 申:jhk 承:bdii 斥:ryi 业:ohhg 狼:ayxy 那:vbh 每:txu 离:ybmc 禹:tkmy 凸:hghg 凹:hnhg 印:qgbh 段:wmcy 追:tnpd 予:cbj 乐:qii 鸟:qgd 体:wsgg 敝:oty 苏:alwu 鬼:rqci 貌:erqn 栽:fasi 低:wqay 派:irqw 辰:dfei 飞:nwi 酋:uzf 制:rmhj 弗:xjk 薄:aiff 曳:jnte 密:pntm 鹿:yxxv 假:wnnc 曹:gmjf 兆:otyy 戌:dgd 甚:swnb 夜:ywtu 便:wgjq 舆:wlgw 祥:pzh 补:phy 即:xbh 着:zhf 寒:pawu 舞:rqaj 览:jtmq 鸢:aqgf 牿:cekg 典:mwu 兵:rwu 毋:xnnt 余:wgsu 餐:hqch 非:hdhd 韭:hdhg 卑:rtfj 丙:gmwu 懈:nqec 瀛:iyny 鬯:obxb 奎:dfff 使:wgkq 决:unwy 矛:cbtr 来:goi 平:gufk 乎:tufk 伞:wufj 巾:mhk 孓:byi 豖:eyi 耒:dii 第六章 以词语为编码单元的中文书写 仅以单字为对象进行中文书写,其书写速度无论如何也不会有大的突破。语言的基本单位是词语,所以元根码是将词语作为重点书写对象的键盘编码方案。使用元根码能够实现以通用词语为基本单元书写文章,从而大幅度提高书写速度。 第一节 词语的编码规则 词语分为双字词语、三字词语、四字词语和多字词语,多字词语由5~15个汉字组成。在元根码中,一个词语无论含多少个汉字,其书写码均为4个。词语的书写码全都来自单字书写码,是由单字的书写码“压缩”而来的,其“压缩”规则极为简单,不仅可以“见词知码”。而且比单字编码更直观、更容易。 词语书写码的编码规则如下: (1)双字词 —— 2+2取码 双字词的书写码是由每个字书写码的前2个组成,如: 饥饿:hmht 狡猾:auam 寒冷:pauw 失散:tzae 厂长:dgdt 大概:ddsx 啰嗦:klkf 瞭望:hdyn (2)三字词 —— 1+1+2取码 前两个字各取第一码,最后一个字取其前两个码,共四码构成三字词的书写码。如: 教师节:zjab 选举权:eisc 驱逐舰:cezm 之所以:prcw 看起来:rvgo 规范性:zanc (3)四字词 —— 1+1+1+1取码 每个字各取其第一码构成四字词的书写码。如: 老当益壮:ziuu 独立自主:auty 流言蜚语:iyhy 身临其境:zjsf 废寝忘食:ypyh 物阜人丰:ctwd (4)多字词 —— 1+1+1… +1取码 取一二三末字的第一码,共四码组成多字词的书写码。如: 生米做成熟饭:cowh 香港特别行政区:tica 失之毫厘,谬以千里:tpyj 山穷水尽疑无路,柳暗花明又一村:mois 第二节 含有符号的词语的编码 元根码的词语中可以包括符号。有两种情况,一是某些现代词汇中含有大写英文字母或其他符号,如:卡拉OK、B超、达·芬奇、γ射线;二是有些词语后面只能是问号或叹号,如:不好吗?、喜从何来?、冲啊!、救命啊!。元根码将它们连同字母、符号都看作一条词语。对这样一些含有符号的词语均按照下面的原则提供书写码:词中的每个符号都当作一个取码汉字;如果词中的符号是英文字母,对它取码时,其第一书写码即为它的小写字母,第二书写码为扩展码;如果词中符号不是英文字母,它的第一书写码与第二书写码均为扩展码。如: B超 bzvv T恤 tznt 卡拉OK hrok X射线 xzxg γ射线 zzxg P型半导体 pguw α粒子 zobb 千瓦·时 tgzj 约翰·施特劳斯 xfzs 冲啊!ukzz 不好吗? gvkz 喜从何来?fwwz 第三节 以词语为基本单元的中文书写原则 (一)以词语为基本单元的中文键盘书写可以大幅度提高书写速度 组成语言的基本单位是词语,任何句子都是由词语组成的。词语包括单字词语和复字词语。作为中文信息化书写方式的元根码,其基本特点就是以通用词语为基本书写单元,从而大大提高了中文书写的速度。例如: 米尔是法国一位小有名气

本文链接:http://meghanmbiro.com/feichengzibujian/526.html