首页 百科知识 五笔字型汉字录入技术

五笔字型汉字录入技术

时间:2022-10-16 百科知识 版权反馈
【摘要】:五笔字型不仅可以用键盘字符代替一个字,而且可以代表一个多字词组。它仍然是已由五笔字型的创立者为用户定义好了的。五笔字型的创立者王永民先生对全部汉字做了十分科学的拆分,并与键盘字符建立了全部的对应关系。“五笔字型”输入法,是供专业或业余人员进行文字录入的一种有效工具,一旦掌握了它,就会一劳永逸。五笔字型对“横、竖、撇、捺、折”作了新的约定。

5.2 五笔字型汉字录入技术

一、体验五笔字型输入

前面我们已经讲到,五笔字型汉字输入法是目前最为优秀的一种汉字输入方法,它在输入速度、输入准确性上是其他输入法所无可比拟的,因为它对于外码与内码的定义几乎是一一对应的,故其准确性极高。一旦学会,将会终身受益。为了对五笔字型有一个初步的认识,我们首先感知一下五笔字型的输入方法,从而领悟其输入的基本要领。

首先看看以下几个汉字的构成与输入方法。

各——我们可以将它看作由“夂”和“口”构成。定义键盘上的T为“夂”,K为“口”(这已经由五笔字型研究者所规定并在五笔字型软件中定义)。然后你敲键盘上的T和K,会出现一个“各”字。这样一个“各”字只需要击两次键便可完成,而且一次完成。并不需要像写汉字一样一笔一笔地完成。

如——它由“女”和“口”两个部分构成,我们仍然可以用一定的键盘字母定义这几部分。敲V和K两键,就可得到你所需要的“如”字。

有一些字表面上看起来很复杂,实际上,在五笔字型的将整体化为“局部”构成的方法下,复杂字的输入方法仍然变得很简单。比如:

键——看起来十分复杂,但我们仅需要四次击键即可完成。你无妨敲Q、V、F、P四键,它便会在屏幕上显示出来。它是如何拆分的,又是如何构成的,在后面我们将专门介绍。

对一些常用字,五笔字型创立者将它们定义为最简单的击键方式,即一个键盘字符即可输入一个汉字,如表5-1所示。

表 5-1

img48

五笔字型不仅可以用键盘字符代替一个字,而且可以代表一个多字词组。它仍然是已由五笔字型的创立者为用户定义好了的。比如无论你在何时输入如下四个键盘字符:K、W、W、L时,你都可以录入“中华人民共和国”这样七个汉字,其规则我们也将在后面讲述。

上面我们初步体验了五笔字型输入方法,可以看出,用五笔字型输入方法输入汉字是十分有效、快捷和十分科学的,它能够十分方便地输入一个字、一个多字词组。而且我们还大致可以看出,五笔字型实际上就是将字的整体或构成字的局部(通常叫做字根)或一个多字词组与键盘字符一一地对应起来,便可以方便快捷地进行汉字输入,而且你对每一个字或一个多字词组的输入击键次数不会超过四次,从而,它减少了输入汉字时的击键次数,大大地提高了汉字的输入速度。现在的关键是,汉字非常多,它能够被分离出多少个这样的字根,这样的字根又是如何与键盘上的26个字母对应的呢?

五笔字型的创立者王永民先生对全部汉字做了十分科学的拆分,并与键盘字符建立了全部的对应关系。这样,如果你记住了全部的键盘字符与字或者字根的对应关系,你便会十分容易地进行几乎全部汉字的录入。我们现在已经明确了五笔字型输入方法的基本原理,后面的任务就是需要我们掌握汉字拆分成字根的一般规则和字根与键盘字符的对应关系。

二、五笔画规则

在介绍五笔字型输入法之前,我们先介绍一下五笔画。因为五笔画与五笔字型输入方法有一些联系。

汉字是一种象形文字,可将汉字划分为四个层次:笔画、字根、单字、词组。汉字每一笔都叫笔画;字根是将汉字分解成各类相对不变的基本图形,是有形有义的构字单位,字根经过拼形组合产生众多汉字。五笔字型提供了两种汉字输入法:一种是面向非专职电脑使用者的简易汉字输入法——“五笔画输入法”,仅具有小学水平的人10分钟即能学会,但这种方法的输入速度不高,因为它对于键盘和笔画之间的对应关系并不是一一对应的关系,而是键入的五个键盘字符可能对应多个汉字。因此,为了对照五笔画和五笔字型输入方法的异同和联系,首先需要对五笔画作一个简单介绍,读者不要将主要的目的放在五笔画上,而应该将主要目的放在五笔字型的学习上。“五笔字型”输入法,是供专业或业余人员进行文字录入的一种有效工具,一旦掌握了它,就会一劳永逸。

五笔画的编码原理是将任何汉字都简化、概括为由五种笔画构成,即横(一)、竖(丨)、撇(丿)、捺(丶)、折(乙)五种。这五种笔画分别用数字代号1、2、3、4、5表示。对应的西文键分别为G、H、N、Y、T五个键。这种简化是在汉字结构认识上的一个飞跃,为汉字字形编码的设计解决了重要的理论问题。这里重要的问题是熟悉汉字笔画的拆分方法与笔顺的新规定。五笔字型对“横、竖、撇、捺、折”作了新的约定。

具体说明如下:

“提”笔视为横:即在出现“提”的笔画时,均看作横,如“现、场、特、扛、冲”等等字的左部末笔的提笔,都视为横。

“点点”均为捺:凡出现点的地方,均看作为“捺”。

“左竖钩”为竖:如“拆、扣、利”等等字中的左竖钩为竖,其他的钩视为折。

而折笔画是各种带转折的笔画走向,如“乙、フ、┑、囗、厶、勹、了”等,即除左竖钩以外的有转折的笔画。

五种笔画在键盘上的约定:

1. 五笔画键盘

img49

五笔画输入法常用键盘右侧的小键盘。五种笔画“1、2、3、4、5”分别对应“横、竖、撇、捺、折”(在后面的五笔字型中我们常常用左边大键盘中的G、H、N、Y、T五个西文键位代替这五个笔顺)。

2. 五笔画取码规则

依照国家规定的标准字形和正确的书写顺序,一笔笔地取码,若总笔画数不足五画,以“0”作结束。例如:

用:丿乙一一丨(35112) 书:乙乙丨、(55240) 大:一丿、(1340)

若汉字超过五笔画,则只取第一、二、三、四及最后一划,总共五个笔画。例如,

数: 、丿一丨、(43124) 总: 、丿丨乙、(43254) 攀:一丨丿、丨(12342)

对于一切难以确定类型的笔画,可用数字键“6”代替。例如“花”字,若难以确定后两个笔画时,可取码为12266,然后在提示行中选取。

对容易弄错笔画顺序的字,系统有容错输入功能。例如“安”、“长”字可以取码为:

安:、、乙乙一(44551) 或 、、乙一丿(44513)

长:丿一乙、(31540) 或 一乙丿、(15340)

当九、力、七等字根处于末笔位置时,一律认为末笔为“折”(5)。

3. 单字输入

“五笔画”也是有重码的汉字输入方式,按五笔画输入汉字时,重码汉字会在提示行显示出来,这时用字母键上方的数字键来选取所需要输入的汉字。例如,输入“一丨丿、一”(12341)之后,提示行将显示:

五笔画:12341 1本SGD 2相SHG 3李SBF 4格STKG 5检SWGI 6植SFHG 7柏SRG 8本SGD

若要“李”字,则按字母键上方的数字键3,“李”字便显示到光标位置处;若要的是“本”字,则不必选择,继续输入下文,“本”字即自动跳到光标位置。

提示行中汉字右边的英文字母,为该字的“五笔字型”的字根输入码。

正选和倒选:若提示行中没有所要的字,可按小键盘上的数字键“9”(或空格键),显示下一页重码汉字,叫做“正选”。按“8”键,倒回去显示前一页,叫“倒选”。

重选:若再次选用当前提示行的其他汉字,可按[Alt]+数字键,例如上面提示行,若选“相”字之后,还要选“本”字,可同时按[Alt]和数字键1。

按Alt+F10键,可不断复制出刚刚显示在光标前边的汉字。

4. 词语输入

“五笔画”输入方法也配有词语输入功能。该功能规定,字数在128个以内的任何词语,不论字数多少,一律只打八个单笔画。具体方法如下:

(1) 在“五笔画”状态下,将小键盘上的数字键“7”按一下后,即可用五个笔画键输入一条词语,若此词语后还要输入词语,仍要再按一次数字键“7”。

(2) 两字词:每一单词取其前四个笔画,共八个笔画。不足四个笔画者,用“6”补足。如,经济:5515 4414;世界:1221 2512;工人:1216 3466;战士:2125 1316。

(3) 三字词:前两个字各取其前面两个笔画,最后一字取四个笔画,共八个笔画,其中不足的笔画一律用“6”补足。如,电视机:2545 1234;计算机:4531 1234;星期二:2512 1166;为什么:4332 3546。

(4) 四字词:每字各取两个笔画,不足者用“6”补足。如,光明日报:2425 2512;五笔字型:1231 4411。

(5) 多字词:四字以上的词语,取第一、第二、第三及最末一字的前两个笔画,不足笔画者仍用“6”补足。如,电子计算机:25 52 45 12;中文信息协会:25 41 32 34。

(6) 重码词语:词语输入时,会在提示行显示重码的词语,每条词前都有一数字,用字母键上方的数字键来选取相应的词语,并显示到光标位置处。若当前提示行没有所要的词语,可按数字键“9”或空格键显示下一页。

三、五笔字型汉字输入方法

1. 五笔字型的起笔与分区

从上面可以看出,虽然五笔画是一种能够进行汉字输入的方法,但由于它采用的方法是键盘字符与笔画之间的对应关系,加之汉字的笔画往往一个字最多可以由20多个笔画组成,编成码时很长很繁,而且难以判断,因而以笔画为基本单位进行文字输入并不简捷,速度也不快。而五笔字型则将字的构成单位加以简化,王永民先生将汉字拆分为130 个相互独立的字根,这是组成全部汉字的基本构成单位。

五笔字型的组字仍从笔画开始。五笔字型对于笔画的约定与五笔画的规定完全一样,只不过我们在使用五笔字型时,不再使用小键盘,而是使用左边的大键盘,并且将键盘分成五个区。第一个区代表横区,通常称为一区,第二个区代表竖区,通常称为二区;第三个区称为撇区;第四个区为捺区;第五个区为折区。

它们在键盘上的分布和对应的键盘字符如下:

img50

在上述键盘的五个分区中:

第一区从右到左:GFDSA,这一区的起笔画全为横,如:一地在要工。

第二区从左到右:HJKL+M,这一区的起笔画为竖,如:上是中国同。

第三区从右到左:TREWQ,这一区的笔画全为撇,如:和的有人我。

第四区从左到右:Y U I O P ,这一区的笔画全为捺,如:主产不为这。

第五区从右到左:NBVCX,这一区的起笔全为折,如:民了发以经。

2. 五笔字型的字根

五笔字型的字根是组成汉字的全部基本单位,这种基本单位与传统汉字编码的偏旁部首差不多,但也有很大区别,它是将全部汉字中一些相对不变的结构划分出来,形成一个独立的部分,由它们可以拼成汉字。如“林”字,即是由两个“木”字所构成,这样木便成为组成林字的一个,即字根。再如“如”字,它由“女”和“口”所组成,“女”和“口”便成为了“如”字的两个基本单位,即字根。但是字根并不完全由整字所组成,它可以是一个字的一个相对独立的部分,如“自己”的“自”字是由“丿”和“目”字所构成;实践的“践”字,是由“口、止、戋”三个字根所组成;再如“便”字,是由“亻”、“一”、“曰”、和“メ”所构成。这即是说,字根可能是成字,也可能是汉字中的一个基本部分。

表5-2 五笔字型基本字根总表

img51

img52

王永明先生将全部汉字拆分为130个基本的字根,反过来,由这130个汉字又可以组成全部的汉字。因此,我们学习五笔字型在很大意义上说就是要学会拆分汉字和记住字根并能用它们组成汉字并进行输入。

五笔字型将130个字根通过分区、编码和助记三种形式列示出来。表面上看,五笔字型的130个字根似乎复杂难记,但其实,五笔字型的字根划分有很强的科学性和规律性,只要掌握规律,是不难学习的。你始终要记住三个方面,即,“分区”——字根所在的区;“编码”——字根所在分区的具体位置,如11、12、13分别代表一区的第一个位置、第二个位置和第三个位置;“助记”——帮助记忆字根的口诀。如果你能将五笔字型字根表背熟,那么,你便基本上掌握了五笔字型录入的主要内容,五笔字型的学习过程是一个由复杂到简单的过程,它是一个“需要大量记忆的学习过程到不需要任何记忆”的运用过程。即是说,一旦你掌握了五笔字型的输入方法之后,好像什么都不需要记忆了。

3. 汉字字根的结合方式与汉字的拆分原则

如前所述,五笔字型将汉字概括成了130个相互独立的字根,任何汉字均可以由它们其中的一部分所拼成。要输入一个汉字,首先得判断这个汉字是由哪些字根所组成,然后按先后顺序敲击这些字根所对应的键盘字符,最终将这个汉字录入到计算机中。这就是说在输入汉字时,必须“按拆分原则拆字,按先后顺序组合”。

这里我们提到了“按拆分原则拆字,按先后顺序组合”,那么,拆分原则是什么?组合原则又是什么?要搞清楚这些问题,首先看看汉字的几种结合方式。

(1) 汉字的结合方式

① 单:一个汉字可能由几个字根构成,而字根本身就可以独立成为一个汉字,而不与别的字根发生关系,这种成字方式就叫单,这样的字根就叫成字字根。如“林”字中的“木”字根,就是这类字根。

② 散:构成汉字不止一个字根,而且字根之间保持一定距离,不相连也不相交。如“培养学生”中的“培”字,它包括了“土、立、口”三个相互独立的字根。

③ 连:在五笔字型中,字根之间的相连关系并不是一般的相互连接着的含义,它是指字根与字根之间的相互关系。如自己的“自”,它由单笔“丿”和字根“目”相连,而充分的“充”字,是由“亠、厶、儿”三个字根相连。正确认识字的相连关系对于汉字的拆分有十分重要的意义,往往在输入时不能准确进行就是因为拆字的错误。归结起来,汉字的相连是指如下两种连接方式。

● 单笔画与基本字根间的连接,主要有以下一些情况:

表 5-3

img53

单笔画与基本字根之间有明显距离者不认为是相连。

● 带点结构,认为相连。这类字型主要有:勺、头、太、术等。这是一种特殊的规定,主要是为了减少分类便于记忆。

④ 交:指两个以上的字根有相互交叉叠合的情形,如“农”字是由“冖”和一个“衣”字的下半部分交叉叠合而成。再如“交”,是由字根“六”和“メ”所构成,也具有交叉的情形。表5-4中的字均属于交的情形。

表 5-4

img54

(2) 汉字的拆分原则

将一个汉字拆分成基本字根或笔画时必须按照以下原则进行:

● 成字字根汉字:不能再拆分,如果再拆分反而破坏了五笔字型的编码规则。如木、月、立、女等不能再拆分了。

● 散结构的汉字:有些汉字本身便由几个单独的字根组成,而且每个汉字字根相对独立,没有多大联系,只需要将其按基本字根表中的字根进行拆分即可。如“朋”它由字根“月”构成;“分”字由字根“八”和“刀”构成,不需要再拆分。再如数学的“数”字,它是由三个字根“米、女、夂”构成。

● 连、交结构的汉字拆分相对复杂一些。主要包括单笔画与字根连接的字的拆分,如自己的“自”,它由“丿”和“目”所构成,按从上至下的顺序进行。再如“下”字它由“一”和“卜”构成。“叉”字由“又”和“丶”构成。“再”字由“一、冂、土”构成。使用时间一长便自然看出拆分的方法。总之,对于交和连字型的拆分我们应按如下规则进行:

取大优先,兼顾直观,能连不交,能散不连。

取大优先——即是说,一个汉字的拆分方法有多种,但应该取最大的字根,也即以最少字根数的拆分方法为准,否则可能会造成输入错误。如:

“体”字,有多种拆分方法:

拆法1:亻、一、八、十

拆法2:亻、木、一

拆法3:亻、本

但注意到拆法3是错误的,因为“本”字本身并不是字根。应该以拆法2为准,因为拆法2具有取大优先的特点。

兼顾直观——拆字时,常常要有一种直观感觉,认为该这样拆。如“自”应拆成“丿”和目,而不拆成“丿、冂、三”,这样看起来很别扭,因而在拆字时应该有一种直觉。

能连不交——能按连接关系进行拆分的,就一定不要按交的关系来进行拆分,否则输入出错。如“于”拆成“一和十”而不应该拆成“二和丨”,后者是交,输入时一定会出现错误。

能散不连——能够按照散的关系进行拆分的,就不要按连的关系进行拆分。如“午”应拆成“和十”,而不应拆成“丿和干”。

(3) 汉字的三种字型与输入顺序

根据构成汉字的各字根之间的位置关系,方块汉字可分为三种类型:左右型、上下型、杂合型。杂合型是指内外型和单体型汉字,各字根间没有明确的左右或上下关系。

表5-5 汉字的三种类型

img55

一个汉字必是上述三种类型之一。在进行字的输入时往往涉及到字根的先后顺序,通常与一般汉字的书写规则很类似,如按从左到右、从上到下等原则进行。如“型”字,输入的顺序应为:一 艹 刂 土。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈