首页 理论教育 现代汉字的定量

现代汉字的定量

时间:2022-03-05 理论教育 版权反馈
【摘要】:(一)现代汉字的字量1.汉字的字量汉字的总数,人们一般认为有五六万。通过以上三条途径,通用层面被精简的汉字总数达上千个。根据历代文字资料的统计,从商代到现代,一般通用层面使用的汉字数量没有显著变化,可能一直在五六千个左右。现代制定的具有通用字表性质的汉字标准,基本上维持这一数目。
现代汉字的定量_现代汉语通论 第三版 上册

(一)现代汉字的字量

1.汉字的字量

汉字的总数,人们一般认为有五六万。历代字书和现代大型字典所收字数统计如下:

汉代《说文解字》:9 353个 宋代《广韵》:26 194个

明代《字汇》:33 179个 清代《康熙字典》:47 043个

现代《汉语大字典》:54 678个 现代《中华字海》:87 019个

表面上看,汉字总量不仅庞大,而且呈现渐增趋势。实际上,总量中包含着大量处于储备状态的字,还有很多异体字。例如《康熙字典》4万多字中,异体字就占了40%。如果去掉这些异体字,按不同的字来统计的话,字种的实际数量会大大减少。所谓的“字种”是指汉字的个体种类(即不同的汉字),异体字、繁体字、简体字和变体字都不影响字种的数量。例如“群、羣”以及“众、衆”都只算一个字种。北京国安资讯设备公司汉字字库收字91 251个,是目前收字较全的字库。如果以各个时代实际使用的汉字为考察对象,就会发现汉字的总量其实是相当稳定的。从汉代到现代,各个时代实际使用的汉字总数都不曾超出一万字。

2.精简字数

汉字的总量和实际用量都不少,适当减少汉字字数是减轻汉字学习和使用难度的办法之一。20世纪50年代以来,主要通过以下途径来精简汉字字数:

(1)淘汰异体字

汉字存在不少音同义同而形不同的异体字。1955年12月,文化部和中国文字改革委员会联合发布了《第一批异体字整理表》,对810组异体字进行整理,淘汰了其中重复多余的异体字1 053个。例如:

窗[牎牕窓窻]/叠[曡疊疉]/劫[刧刼刦]/烟[煙菸]/炮[砲礮]/村[邨]/群[羣]([ ]前是选用的正体字,[ ]内是被淘汰的异体字)

2013年公布的《通用规范汉字表》对异体字又进行了科学调整。

(2)更改地名生僻字

我国地名中有些生僻字除去记录地名外没有其他用处。从1956年到1964年,经国务院批准,用同音的常用字代替了35个县级以上地名中的生僻字,共精简了15个地名字。例如陕西的“盩厔县”改为“周至县”,青海的“亹源县”改为“门源县”,新疆的“和阗县”改为“和田县”,江西的“雩都县”改为“于都县”,四川的“越嶲县”改为“越西县”,等等。(详见《简化字总表》附录)

(3)统一计量单位名称用字

我国计量单位名称用字中,过去有不少特造的计量字。有的口头上说时是双音节,书面上却只写作一个字形。1977年7月,中国文字改革委员会和国家标准计量局联合发布了《部分计量单位名称统一用字表》。该表通过统一计量单位名称用字,精简了20个字,例如“呎”“吋”“瓩”“呏”和“竔”都被淘汰。

通过以上三条途径,通用层面被精简的汉字总数达上千个。

(二)现代汉字的通用量和常用量

1.现代通用汉字的数量

通用汉字就是书写现代汉语通常要用到的字,也就是除去有特定使用范围的专用字和罕用的生僻字以后的那一部分字。

根据历代文字资料的统计,从商代到现代,一般通用层面使用的汉字数量没有显著变化,可能一直在五六千个左右。现代制定的具有通用字表性质的汉字标准,基本上维持这一数目。出版印刷方面:2013年国务院公布的《通用规范汉字表》,其中主要满足出版印刷、辞书编纂和信息处理等方面的一般用字需要的一、二级字表收字6 500个。信息处理方面:1981年国家标准局发布的GB2312 80《信息交换用汉字编码字符集·基本集》收字6 763个。电报通讯方面:1983年邮电部编制出版的《标准电码本》(修订本)收字7 000多个。国家语言资源监测与研究中心2007年调查报纸、广播电视、网络(新闻)用字情况,测得报纸、广播电视、网络三种媒体都出现的汉字字种也只有6 192个。

通用字是相对于专用字而言的,因此通用字的数量确定后,还要研究各种专业用字的字量,并根据专业的门类制订各种专用字表。专业用字可分为姓名专用字、史地专用字、科技专用字、宗教专用字、民族专用字、译音专用字、方言专用字等。

2.现代常用汉字的数量

常用字就是书写现代汉语时经常要用到的字。汉字总字数很多,通用字的数量也不少,可是人们经常使用的字量并不多,往往只集中在有限的两三千个字种上。据统计,孙中山的《三民主义》只用了2 134个字种,老舍的《骆驼祥子》只用了2 413个字种,《曹禺选集》(《雷雨》《日出》《北京人》)只用了2 808个字种,即使长达五卷的《毛泽东选集》也只用了3 136个字种。这说明人们实际上经常使用的汉字数量是有限的。

如果我们根据政治论文、文艺作品、新闻通讯、科学技术等几方面的语料作字频统计,那么现代汉语用字集中的情况将进一步得到证实。下面我们综合各家字频统计的结果,列表说明一个大概情况。

该表说明,前1 000个高频字种能覆盖全部被统计语料的90%,前3 800个高频字种能覆盖全部被统计语料的99.9%。汉字用字相对集中的情况给我们一个重要启示:学习和掌握汉字,必须首先抓住出现频率高的那些常用字,它们是汉字学习的重点。

3.现代汉语常用字的特点

(1)常用性。主要的依据是该字出现的频率,例如“的、一、是、在、不、了、有、和、人、这”等字在各家的统计资料中出现频率都是名列前茅的。

(2)能产性。常用字大都构词能力比较强,由于能产性强,经常被选作记录新词语的构成成分。例如“电”字,由它参与构成的词多达数百个。

(3)稳定性。虽然社会发生了很大变化,但人们在书面交际中最常用的字却相对稳定。这是因为常用字记录的语素所代表的事物本身具有稳定性。常用字的稳定性说明一份科学的常用字表具有相当长的时效性。

(4)简易性。指书写简易。高频字因为经常使用,成为简化的重点对象。高频趋简,这是汉字字形发展演变的一条重要规律。以《现代汉语常用字表》为例,2 500个常用字中,简化字共837个,占33.4%;1 000个次常用字中,简化字共279个,占27.9%;两者合计,3 500个常用字,简化字共1 116个,占31.8%。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈