首页 理论教育 我国外语类辞书编纂出版现代化的理论研究

我国外语类辞书编纂出版现代化的理论研究

时间:2022-04-01 理论教育 版权反馈
【摘要】:我国外语类辞书编纂出版现代化的理论研究_中国外语类辞书编纂出版30年一、我国外语类辞书编纂出版现代化的理论研究在国外辞书编纂先进理念和具体实践的影响下,基于已有计算机、计算语言学和计算词典学的具体知识和技术,结合汉语本身的特征和具体的辞书编纂实践,国内的学者对辞书编纂与出版现代化理念进行了积极和卓有成效的思考与研究。

一、我国外语类辞书编纂出版现代化的理论研究

在国外辞书编纂先进理念和具体实践的影响下,基于已有计算机、计算语言学和计算词典学的具体知识和技术,结合汉语本身的特征和具体的辞书编纂实践,国内的学者对辞书编纂与出版现代化理念进行了积极和卓有成效的思考与研究。李宇明教授曾指出:“中国应努力促进辞书编纂手段现代化,开发功能强大的语料库、知识库和适用于辞书编纂的软件系统;应大力发展电子辞书,特别是光盘辞书和网络辞书,迅速占领虚拟空间,走辞书综合集成之路。在印刷业告别‘铅与火’进入‘光与电’的时代,只有用现代化手段才能圆辞书强国之梦。”(9)从相关文献资料来看,国内研究者关于辞书编纂与出版现代化的理论探索也基本集中在语料库、词典编纂系统、词典数据库和数字化出版这几个方面。

1﹒语料库相关的理论研究

根据国内外语学习(主要是英语学习)的具体需要,在服务于双语辞书编纂的语料库理念探究中,英语单语、汉语单语、英汉/汉英双语这三类语料库的构建是重点。国内较早提出基于英语单语语料库获取词典的条目频次,抽取条目相关例证的单位之一是南京大学双语词典研究中心。该中心学习和借鉴英国早期语料库构建的经验,在1997年完成了当时国内较大规模的英语单语语料库的构建,同时还充分利用自身英汉/汉英翻译研究的特色优势,创建了英汉对照的平行句库。随着计算语言学和文本挖掘相关技术的发展和日益成熟,该中心结合双语辞书编纂研究的需要构建了英汉/汉英平行语料库,并对语料库中的汉语语料进行了分词和词性标注,对英语语料也进行了词性标注。此后,广东外语外贸大学词典学研究中心的专家学者对语料库与语料库词典学也从多个方面进行了阐述,并基于相关的语料库理念建立了“法—汉双语双向平行语料库”。北京外国语大学的词典学研究者从英汉学习词典编纂的具体需要出发,对英汉对应词的获取提出了“根据统计结果建立索引文件并将候选对应词按照共现概率排序,从而达到便捷提取对译语料库中对应词的目的”(10)这一理念,并进行了简单的实验。中国人民解放军南京国际关系学院的李德俊从汉英词典编纂的实际需要出发,较为全面而系统地回顾了多个语种相关的平行语料库构建,并提出了“收录3种不同形式的语料:英汉单向平行语料、汉英单向平行语料和英汉双向平行语料。由于系统语料库是开放式的,可以随时添加新的语料,所以规模会随需要不断扩大,符合监控语料库的要求”(11)的语料库构建理念。北京大学计算语言学研究所的常宝宝就平行语料库的重要性提出了“‘编纂平台’最为基础的资源是大规模语料库。作为双语词典的编纂平台,双语对齐语料库不可或缺。平行语料库由互为译文的两种语言文本构成,通常文本之间依据翻译关系建立不同层次的对齐关系”(12)的观点。华东师范大学的王馥芳从理论上探究了语料库的积极作用,她明确指出:“语料库语言学致力于描述语言在自然语篇中的行为方式,并据此辨认出使用者们最常遇到的语词用法,而不依赖于词典编者对意义和用法的主观印象。语料库语言学对语言研究所持的这种纯‘客观态度’,是‘事实词典’赖以存在的基础。”(13)与此同时,她也强调了语料库的局限性,即依据语料库释义可能存在偏差、例证的不完全代表性和固定表达收录过繁等问题。

2﹒词典编纂系统相关的理论研究

在已有计算机、计算语言学和计算词典学知识和技术的基础上,国内的研究者对词典编纂系统进行了相关的理论研究。南京大学双语词典研究中心提出了开发CONULEXID英汉词典编纂系统的设想并付诸实践。该词典编纂系统是一个基于语料库的双语词典编纂系统,其目的是为词典编纂提供真实的新鲜语料,并且实现词典信息自动查找、自动派生词典、自动修订以及自动排版等辞书编纂相关功能。在CONULEXID词典编纂系统的基础上,结合最新的相关技术,该中心又推出了面向网络的英汉双语词典编纂系统NULEXID,该新系统是对前者的技术升级,而这与辞书编纂需求的进一步细化完善密不可分。此外,广东外语外贸大学词典研究中心则积极致力于通过互联网建立安全、稳定的词典编纂及生成平台研究与探索,旨在实现词典编纂生成全过程数字化、自动化与规范化,从而最大限度地利用现有资源,高效率地完成词典编纂出版工作。北京外国语大学的熊文新博士利用C#设计了一个具有友好人机用户界面的词典编纂系统,利用数据库技术对词典进行有效的管理,通过语料库保障了词条例证及搭配信息的准确和可靠,同时词典信息内容的格式反馈也增强了系统的用户友好性。李德俊提出了基于英汉双语平行语料的词典编纂系统CpsDict开发的理念,CpsDict系统共有4个模块,分别是英汉平行语料库、英汉语句段自动对齐模块、检索和词典编写输出系统和个人语料库管理模块。北京大学计算语言学研究所常宝宝基于“‘编纂平台’并不取代词典编纂者的工作,而是协助编纂人员完成词典编纂,力图在语言技术、计算机技术和编纂人员智慧之间寻求一个最佳结合;在提高词典编纂质量的前提下,将编纂人员从繁杂的非智力工作中解放出来,使他们得以专注于词条的描述,从而提高编纂效率,降低编纂成本”(14)这一理念,开发了具有多种功能的辅助英汉双语词典编纂的系统。

3﹒词典数据库相关的理论研究

词典数据库是词典编纂系统最后生成的词典标准数据结果。由于国内词典编纂系统尚处于初步发展阶段,关于词典数据库的研究相对语料库和词典编纂系统来说较为薄弱。南京大学双语词典研究中心在CONULEXID和NULEXID词典编纂系统的研发基础上,生成了以《新时代英汉大词典》为基础的英汉词典数据库并提出了使用数据挖掘的相关技术对其进一步进行知识挖掘的设想。广东外语外贸大学词典研究中心的刘辉基于词典数据库是词典编纂及生成系统的关键组成部分的认识,结合词典生成系统,阐述了数据库的内部结构和词典生成系统的多层数据结构框架,并用实例的方法探讨实现这一系统的几项关键技术。北京外国语大学的熊文新博士在设计词典编纂系统的过程中也考虑到词典数据库的问题,即“词典以词条为基本单位,对应于数据库中的一条记录。而同一词条下又可以设有同形异类词(一个词形多个词类)、派生词及短语词等”(15)

4﹒辞书数字化出版的理论研究

在国外辞书数字化出版理念及相关实践的影响下,同时得益于国内对辞书数字化产品的需求推动,国内的研究者对掌上电子词典、个人电脑词典、在线词典和手机词典等各种辞书数字化出版形式进行了广泛而深入的探讨,提出了一些非常有价值的辞书数字化出版的理念和构想。章宜华在《计算词典学与新型词典》(16)一书中对掌上电子词典、个人电脑词典及在线词典进行了全方位、多角度的介绍,并详细剖析和研究了各媒介下电子词典的功能和特征。张柏然和魏向清对词典在各种介质下的出版阶段进行了生动而具体的概述,并且认为媒质和载体的每一次改进都促进着词典文化传播的广度和深度。他们根据人类辞书出版的媒质和载体的不同把辞书历史发展的阶段分成了四段。第一阶段是以“手”和“纸”为工具的手工书写阶段;第二阶段是以“火”与“铅”为特色的印刷阶段;第三阶段是以“光”与“电”为标志的计算机时代;第四阶段是以“网”与“天”为特征的网络新纪元。(17)杨德炎认为在人类进入21世纪之时,诞生了一种崭新的出版理念,那就是数字化的电子介质出版物的制作——无纸出版。他还进一步指出,国内外依靠计算机建立起来的大规模语料库事实上早已具备了纸介质词典的各种查询、检索功能,随着多媒体和网络技术的发展,语料库功能在不断扩展,它已超越纸介质词典的束缚,能够提供声音、图像、真实的语言背景以及远距离传输、编辑、下载等服务。(18)王宪洪在分析了大量在线词典的基础上,归纳总结了在线词典的如下特征:(1)智能化检索:词典用户不仅可以进行精确查找,还可以在模糊中查找相应单词,即使词典使用者输入的信息不正确,词典也会通过联想功能,提供与这个信息相关的词语信息。(2)人性化显示:在线词典既可以根据词形查找词目,还可以依据概念等查找与某个词意义相联系的词。(3)多媒体表达:在线词典的词目词不仅可以展示印刷版文本词典无法展示的读音,还可以展示精美的图片、计算机动画和影视图像等。他还进一步归纳描述了在线词典的互动性、动态性和集合性三个本质特性。(19)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈