3.3 五笔字型输入法的使用
五笔字型输入法属于形码编码输入法,它是以汉字的字形为特征进行编码的,这样不会拼音的用户依然可以学打字。五笔字型输入法以其输入速度快、重码率低、不受方言限制等优点傲视群雄,成为办公人员的首选输入法。
五笔字型输入法的种类也很多,如万能五笔、极品五笔、极点五笔、搜狗五笔等,这些输入法除了编码和功能稍有差别外,其输入汉字的基本方法相同,本节将以极品五笔为例进行介绍。
3.3.1 五笔字型输入法基础知识
由于五笔字型输入法的原理是将汉字根据“横(一)、竖(丨)、撇(丿)、捺()、折(乙)”5种基本笔画进行分割,并定义其汉字编码,所以在使用五笔字型输入法前,需要先掌握有关汉字的基础知识,这是学好五笔字型输入法的前提。下面将介绍汉字的层次、汉字的笔画和汉字的字形结构。
1.五笔汉字的3个层次
我们都知道汉字经历了漫长岁月的演变,其总数非常庞大。汉字的最小构成单位是笔画,为了方便用户在电脑中输入汉字,五笔字型输入法引入了字根的概念。因此,在五笔字型的汉字输入法中,从汉字的组成结构来看,汉字具有3个层次,分别为笔画、字根与汉字,如下图所示。
▪ 笔画:指常说的横(一)、竖(丨)、撇(丿)、捺()、折(乙)。每个汉字都是由这5种笔画组合而成。
▪ 字根:指由若干笔画复合交叉而形成的相对不变的结构,它是构成汉字最基本的单位,也是五笔字型编码的依据。如“种”字由“禾”和“中”组成,“禾”和“中”就是字根。
▪ 汉字:将字根按一定的位置和方式组合起来就形成了汉字。
五笔汉字3个层次之间的关系如下图所示,由5种基本笔画组成不同的字根,再由相关字根即可组成汉字。
2.五笔汉字的5种笔画
在书写汉字时,一次写成的一条连续不断的线条即是笔画。根据对成千上万的汉字分析发现,若只考虑笔画书写时的运笔方向,而不计其轻重长短,可将笔画分为横、竖、撇、捺、折5种。如运笔方向为从左到右或从左下到右上的所有笔画都属于横类(一)。
在五笔汉字中为了编码方便,按照这5种基本笔画的顺序、使用频率的高低,用数字1~5共5个代码进行排列,如下表所示。
3.五笔汉字的3种字型
一个汉字可以拆分为若干个字根,从各字根之间的位置关系来看,汉字的结构多而复杂。但总体上可将汉字的字型分为3种结构,分别为左右型、上下型和杂合型。
▪ 左右型汉字:指能拆分成有一定距离的左右两部分或左、中、右3部分的汉字。每一部分可以是一个基本字根,也可以是由几个基本字根组合而成。
▪ 上下型汉字:指能拆分成有一定距离的上下两部分或上、中、下3部分的汉字。
▪ 杂合型汉字:指各组成部分之间没有简单明确的左右型或上下型关系的汉字。凡是组成整字的各部分不能明显地分割为上下两部分和左右两部分的汉字都属杂合型。
按照各类型拥有汉字的多少依次用代码1、2、3来表示,如下表所示。
从上表中不难看出,在五笔汉字的3种字型中最难区分的是杂合型结构的汉字。在五笔中,对于杂合型结构的汉字有如下规定。
▪ 内外型的汉字一律规定为杂合型。如“周”“过”“延”“因”等汉字,每一个部分之间都是包围与被包围的关系,一律视为杂合型。
▪ 单笔笔画与一个字根相连所构成的汉字规定为杂合型结构。如“卫”“自”“万”等汉字。
▪ 一个基本字根加上一个孤立点构成的汉字,无论字中的点与基本字根是否相连,该字均被视为杂合型。如“户”“刁”“勺”“太”“叉”“术”等汉字。
▪ 几个基本字根交叉套叠之后构成的汉字规定为杂合型结构。如“东”“里”“果”“未”“末”等汉字。
▪ 由一个基本字根构成的汉字,如“水”字,也属于杂合型。
3.3.2 五笔字根的分布
五笔字型输入法实际上就是将汉字以正确的书写顺序拆分成不同的字根,然后按下各字根对应的键位组成编码,从而输入该汉字。因此,掌握五笔字根在键盘上的分布位置是学习五笔的关键所在。
五笔字型输入法(86版)的编码方案是从大量的字根中优选出130个最常用的字根作为基本字根,并将这130个字根按照五笔字型组字频度与实用频度,在音、形、意方面进行归类,同时考虑到键盘上除【Z】键以外的25个英文字母的排列方式,合理地将各字根分布在【A】~【Y】共计25个英文字母键上,这就构成了五笔输入法的字根键盘,如下图所示。
五笔字型输入法的字根分布并不是杂乱无章的,其在键盘上的分布规律主要表现在如下两个方面。
▪ 区:五笔字型输入法根据每个字根的起笔笔画把基本字根分为5类,并将键盘上除【Z】键外的25个字母键分为横、竖、撇、捺和折5个区,依次用区号1、2、3、4、5表示。1区的字根首笔画为“横”,2区、3区、4区和5区字根的首笔画分别为“竖”“撇”“捺”和“折”。
▪ 位:五笔字根键盘的每个区中有5个字母键,每个键被称为一个位,从中心向两边依次用代号1、2、3、4、5表示位号,如在1区有【G】、【F】、【D】、【S】和【A】5个键,【G】的位号为1,【F】的位号为2,依此类推。
将每个键的区号作为第一个数字,位号作为第二个数字,组合起来就形成了“区位号”,每个键都有一个唯一的区位号,各键位的区位号如下图所示。
为了方便大家记忆字根在键盘上的分布,把常用字根全部安排在对应的键位上,如下图所示。
此外,五笔输入法的创建者总结了字根助记口诀,如下表所示。口诀中的有些助记词与实际五笔字根不相同,在记忆时应思考每句口诀的含义,从而与相关的字根联系起来,这样就能帮助你联想到大部分字根,然后再结合拆字时记住的某些特殊汉字的拆分便可以掌握全部字根。
3.3.3 拆分汉字
记住了字根在键盘上的分布位置,就可以拆分汉字了。在拆分汉字前了解字根构成汉字的方式及拆分规则有助于准确地拆分,从而提高输入汉字的速度。
1.汉字的字根关系
不同的字根在组成不同的汉字时,字根与字根之间的位置关系是多种多样的。为方便学习,五笔输入法将这些位置关系按照一定的规律统一划分为单、散、连和交4种类型,各类型的含义分别如下。
▪ 单:汉字本身就是一个基本的五笔字根,不需再将其进行拆分,这种汉字的字根关系即为“单”。键名字和成字字根都属于此类,如“五”“斤”“大”“厂”“几”“口”“又”“车”“金”等。
▪ 散:汉字由多个基本字根构成,而且组成汉字的字根之间有一定的距离,这种字根之间的关系称为“散”。左右型和上下型的汉字都属于散结构,如“江”“空”“格”“树”“湘”“连”“国”“德”等。
▪ 连:由一个基本字根和单笔画组成的汉字属于“连”结构。此外,由孤立的点笔画和一个基本字根构成的汉字也都归属于“连”结构,而不论点与字根的位置关系,特别注意不要将其当成“散”结构。如“且”“开”“自”“千”“卫”“义”“太”“为”“勺”等。
▪ 交:汉字由几个基本字根相互之间交叉相交而成,这种字根之间的关系称为“交”,这类汉字有一个显著的特点,字根与字根之间一定没有距离,且都属于杂合型字型。如“申”“中”“夹”“本”“夷”“未”“电”“里”等。
2.五笔打字的拆分原则
学习了字根以及各字根在键盘上的分布后,就可以将汉字拆分为几个独立的字根了。但若让我们随心所欲想怎么拆就怎么拆,在拆分时可能会遇到一个汉字存在多种拆分方法的情况,如“天”字既可拆分为“一、大”,又可拆分为“二、人”。为此,五笔输入法规定了一些拆分原则,在拆分汉字时必须遵循以下几条原则。
▪ 拆分为基本字根:在拆分汉字时,一定要保证拆分出的字根为基本字根,即能在键盘字根表中找到的字根。例如,“种”字可以拆分为“禾、中”。“禾”可以在字根表中找到,而“中”却找不到,因为“中”不是基本字根,所以这种拆分方法是错误的。
▪ 书写顺序:在拆分汉字时,首先应按照书写汉字的顺序进行拆分,即从左到右,从上到下,全包围汉字从外到内,半包围汉字从内到外。例如,“宁”字应从上到下拆分为“宀、丁”;“你”字应从左到右拆分为“亻、尔”;“圆”字应从外到内拆分为“口、口、贝”。
▪ 取大优先:在拆分汉字时,应尽量使拆分出的字根笔画最多,即该字根在字根表中是最大的字根,这样拆分后的字根数量才会最少。例如,“测”字应拆分为“氵、贝、刂”,而不应拆分为“氵、冂、人、刂”。
▪ 能散不连:在拆分汉字时,能将汉字拆分成“散”结构的字根就不拆分成“连”结构的字根。例如,“午”字应拆分为“、十”(字根散开),而不应拆分为“丿、干”(字根相连)。
▪ 能连不交:在拆分汉字时,能将汉字拆分成相互连接的字根就不拆分成相互交叉的字根。例如,“生”字应拆分为“丿、”(字根相连),而不应拆分为“、土”(字根相交)。
▪ 兼顾直观:拆分出来的字根要尽量符合一般人的直观感受,如拆分时笔划不能重复或是截断。例如,“且”字应拆分为“月、一”,而不应拆分为“冂、三”。
小提示
在五笔输入法汉字拆分原则中,首先应遵循书写顺序,当其他几个规则发生冲突时(如一个汉字在拆分时既有“散”的拆法,又有“连”和“交”的拆法),拆分字根“大”优先,“散”比“连”优先,“连”比“交”优先,同时应兼顾直观。
3.3.4 用五笔输入法输入单个汉字
了解和掌握了五笔输入法的相关基础知识后,就可以使用五笔输入法练习单个汉字的输入了。五笔汉字可分为键面汉字、键外汉字和简码字3大类。
1.输入键面汉字
键面汉字是在五笔字型字根表里面存在且本身就是一个汉字的字。键面字又可以分为键名汉字、成字字根汉字和单笔画3类。
(1)键名汉字
观察五笔字型字根表,会发现每一个键位的左上角的字根本身就是一个有意义的汉字(【X】键上的“纟”除外),这个字根就称为键名汉字。这类汉字是相应键位上的所有字根中最具有代表性的字根。五笔键盘共有25个按键,所以也有25个键名汉字。键名汉字的输入方法是:连续按4次该字根所在的键。例如,要输入键名汉字“金”,则连续按4次【Q】键即可,其他按键对应的键名汉字如下图所示。
(2)成字字根汉字
在五笔字型字根表中,除了键名汉字外,还有一些完整的汉字称为成字字根汉字,如【G】键上的“王”字根、【S】键上的“西”字根等。
输入成字字根的方法是:键名代码+首笔代码+次笔代码+末笔代码,即先按该字根所在的键(叫作“报户口”),再按照该字根的笔画顺序,分别按该字第一、第二及最后一个笔画所对应的键。如果该字根的笔画数不足3个时,则最后用空格补上。成字字根的录入举例如下表所示。
(3)单笔画
在五笔字型字根表中,有横(一)、竖(丨)、撇(丿)、捺(丶)、折(乙)5种基本笔画,也称单笔画。单笔画也可以用五笔输入法轻松输入,具体方法是:连续按其所对应的键位两次,然后再按【L】键两次。例如,要输入单笔画“丿”,由于“丿”所在的字母键为【T】,所以首先按两次【T】键,再按两次【L】键,得出“丿”的编码为“TTLL”。
2.输入键外汉字
键外汉字就是指除键面汉字外的所有汉字,该类汉字的数量最庞大,输入这些汉字时就必须输入汉字各个字根的编码了。根据汉字拆分的字根多少,又可以将键外汉字分为两种类型。一种汉字的字根个数刚好4个或多于4个;另外一种汉字的字根个数少于4个。下面分别介绍这两类汉字的录入方法。
(1)刚好或超过4个字根的汉字
由4个或4个以上字根组成的汉字,在输入时首先应进行正确拆分,然后按该汉字的第一、第二、第三和最后一个字根所对应的键。刚好4个字根的汉字录入举例如下表所示。
超过4个字根的汉字录入举例如下表所示。
(2)不足4个字根的汉字
当需要输入的汉字拆分出来不足4个字根时,按完所有字根对应的键后可能输入的并不是需要输入的汉字,或者会出现很多汉字供用户选择(也叫重码)。这时就可以通过添加“末笔字型识别码”来对文字加以识别。
末笔字型识别码实际是指一个编码,它由汉字的“末笔识别码”和“字型识别码”组成一个两位数,十位上的数字与末笔的笔画代码对应,个位上的数字与汉字的字型代码对应,其中左右型为1,上下型为2,杂合型为3。将这两位数对应键盘上的区与位后,即可得到五笔汉字的末笔字型识别码,其在键盘上的分布如下表所示。
由上表可以看出,拆分字的最后一笔笔画确定末笔字型识别码在哪一个区,该字的结构确定识别码在该区的哪一个键位上。如“余”字的最后一笔为“”,末笔识别码为“4”,字型为“上下型”,字形识别码为“2”,因此其末笔字型识别码为“42”,对应的键位为【U】键。
小提示
需要注意的是,如果为某个汉字添加末笔字型识别码之后仍不足4个按键时,可以按空格键来代替。其次,有些汉字在按拆分得到字根对应的按键后按空格键即可输入。
不足4个字根的汉字录入举例如下表所示。
3.输入简码字
为了提高汉字的输入速度,五笔输入法按汉字使用频度的高低,对一些常用汉字的编码进行了简化,即简码。在输入这些汉字时可以按它的全码来输入,但在输入过程中可能只输入了该汉字的部分字根编码便完成了汉字的输入。五笔字型共有3类简码汉字,分别是一级简码汉字、二级简码汉字和三级简码汉字。
(1)一级简码
一级简码又叫“高频字”,它是根据每一个键位上的字根形态特征,为每个键(【Z】键除外)安排的一个使用频率较高的汉字。一级简码共有25个,其在键盘上的分布如下图所示。在输入一级简码时,只需按下简码汉字所在键位,再按空格键即可。例如,要输入一级简码中的“我”字,只需按一次【Q】键,再按一下空格键即可。
(2)二级简码
二级简码汉字是用该汉字的前两个编码键加一个空格键作为该汉字的录入编码,从而避免了输入其余编码或交叉识别码带来的麻烦,因此输入速度相对较快。五笔字型输入法挑选了一些比较常用的汉字作为二级简码,大约有600个。某些键面字也是二级简码,如“五”“三”“九”“力”等。二级简码录入举例如下表所示。
(3)三级简码
三级简码由汉字全码的前3码组成,输入时先按汉字的前3码,然后按空格键。虽然也要敲击4次键位,但减少了对末笔编码或末笔字型识别码的判定,所以对于提高速度也是有一定的帮助。三级简码录入举例如下表所示。
3.3.5 用五笔输入法输入词组
通过五笔输入法的词组输入功能,可以快速提高输入速度。一个词组无论包含多少个汉字,取码时最多只能取4码。其输入方法分为以下几种情况。
(1)二字词组
二字词组即由两个汉字构成的词组。日常生活中有很多二字词语,在输入这类词组时,分别取每一个汉字的前两个编码组成4码。例如,要输入词组“昨天”,则分别取这两个字的前两个字根“日、”和“一、大”,其编码为“JTGD”。
当“键名字”和“成字字根”参与组词时,一定要按键名字或成字字根的标准编码方法进行拆分取码,从它的全码中取码。例如,要输入词组“四川”,则分别取这两个字的前两个字根“四、丨”和“川、丿”,其编码为“LHKT”。
(2)三字词组
三字词组是由3个字所组成的词组,在输入这类词组时,分别取前两个汉字的第一码,再取第三个汉字的前两码。例如,要输入词组“计算机”,则依次取第一个字的第一个字根“讠”,第二个字的第一个字根“”,再取第三个汉字的前两个字根“木、几”,其编码为“PWUK”。
(3)四字词组
4个字的词语是很多的,在输入这类词组时,分别取每个字的第一码即可。如要输入词组“从容不迫”,则各取每个字的第一码“人、宀、一、白”,其编码为“WPGR”。
(4)多字词组
多字词组指由4个以上汉字所组成的词组,一般是谚语或特殊名词等。在输入这类词组时,先取前3个汉字的第一个编码,再取最后一个汉字的第一个编码。例如,要输入词组“此地无银三百两”,则分别取前3个汉字“此”“地”“无”的第一码“止、土、二”,再取最后一个汉字“两”的第一码“一”,其编码为“HFFG”。