首页 理论教育 语料库数据驱动技术在科技翻译教学中的应用

语料库数据驱动技术在科技翻译教学中的应用

时间:2022-04-03 理论教育 版权反馈
【摘要】:语料库数据驱动技术在科技翻译教学中的应用语料库是指在随机采样基础上,收集到的有代表性的真实语言材料的集合,是语言运用的样本。在此,本文特以自建的“科技文献‘致谢’英译教学语料库”为例,将这一方法总结成文,旨在语料库数据驱动技术引入普通科技翻译教学方面抛砖引玉。

语料库数据驱动技术在科技翻译教学中的应用

语料库是指在随机采样基础上,收集到的有代表性的真实语言材料的集合,是语言运用的样本(杨惠中2002:8)。语料库数据驱动(data driven)是20世纪50年代后期发展起来的新兴研究技术,以其研究结果的可靠性、真实性、客观性和概率特性备受翻译研究的青睐。翻译研究常用的语料库有平行语料库(parallel corpus)、多语语料库(multilingual corpus)和可比语料库(comparable corpus)等三种类型。这些语料库主要用于研究翻译的性质、翻译过程的制约因素和翻译的规范等内容(廖七一2000:380—381)。然而,对于翻译教学,尤其是普通词、句和篇章的科技翻译教学来说,语料库数据驱动技术却陷入了“高处不胜寒”的尴尬境地。究其原因,不是普通的科技翻译教师不想运用这一高科技手段,而是许多人为因素,如大型语料库及其专业分析软件的知识产权保护等,给这一技术在科技翻译教学中的推广和普及设置了许多障碍,从而造成了国内外少数几个研究机构垄断,而普通科技翻译教师只能“望库兴叹”的局面。

其实,普通科技翻译教师完全可以依靠自己的力量打破这种垄断,在自己的教学实践中,按照科学的方法自建语料库,并通过网络上提供的免费专业分析软件,获取自己教学所需的数据驱动信息。在近几年的科技翻译教学实践中,笔者曾利用这种软件对自建语料库进行数据驱动分析,并取得了较好的教学效果。在此,本文特以自建的“科技文献‘致谢’英译教学语料库”为例,将这一方法总结成文,旨在语料库数据驱动技术引入普通科技翻译教学方面抛砖引玉。

1.语料库的建立

1)建库原则 (1)操作性:语料库的使用对象是普通教师,故建库方法对他们来说应具有较强的操作性;(2)代表性:代表性是语料库建设的首要原则,所收录的语料应该最大限度地涵盖教学内容的各个方面,且须合理配置不同内容间的语料搭配比例;(3)随机性:选取语料时,应严格遵循随机采样的原则,以避免人工选择的主观干预;(4)库容:理论上讲,库容越大越好,但在实际操作过程中,要考虑“投入与产出比”。按国际惯例(Giannoni,D.S.2002:1—31;Jose,M.2000:63—86),在把握好采集语料代表性和随机性的基础上,一般以100篇(幅)左右为宜(参见注释)。

2)“科技文献‘致谢’英译教学语料库”的建立:根据上述原则,以电子期刊全文数据库文献为主,从每本期刊2002年第1期的第1篇文章开始搜索,如果有“致谢”即选中下载,如没有“致谢”部分的,搜索下一篇,直至出现“致谢”。将所选部分转换成文本,并设置成一个独立的文件保存于同一根目录下。所建语料库的基本情况如表1和表2所示。

表1:“致谢”语料库的学科分类

img100

注:比例与每科细分类均仿照JDEST(上海交通大学学术英语语料库)(卫乃兴2002:3)。

表2:“致谢”语料库的概况

img101

3)语料库专业分析软件的获得:语料库专业分析软件很多,有的价格昂贵,操作复杂,如Wordsmith。也有的功能较强,操作简单,可由网上免费下载,如TACT(Text Analysis Computing Tools)。笔者使用的是Tact 2.1,该软件由多伦多大学Bradley,J.,Presutti,L.,Stairs,M.和Lancashire,I.联合开发,是目前功能最全的免费语料库专业分析软件。下载地址:ftp://ftp.chass.utoronto.ca/pub/cch/tact/(不需注册,发稿前笔者已检测,该软件能正常运行)。该软件基于DOS平台,帮助系统非常完善,对使用者无任何计算机和语料库知识方面的特殊要求。

2.语料库数据驱动分析结果

在建好语料库和获得语料库专业分析软件之后,教师即可通过专业分析软件,从语料库中摄取自己所需的数据驱动信息。限于篇幅,本文仅以“thank类词汇”语料库数据驱动句式分析为例介绍语料库数据驱动分析方法在教学中的应用(见表3—表5、图1—图4)。

通过TACT的词频统计功能,在所列举词汇中挑选表示“谢意”的核心(或称节点词)词汇,共191个,分五类(括号内为库内出现频次):“thank类词汇”(92次)、“grateful类词汇”(46次)、“acknowledge类词汇”(34次)、“indebted类词汇”(8次)、“appreciate类词汇”(7次)和“gratitude类词汇”(4次)。“thank类词汇”在本语料库中的出现频次为92次,其中,thank(v.):81次,thanks(n.):8次,thankful:3次。它们的数据驱动句式分析结果如下:

1)thank(v.)

表3:“thank(v.)”语料库数据驱动分析结果

img102

注:括号内百分比表示该用法在该句型内的比例,括号前的数字表示该用法在语料库出现的频数。

表3的结果提示“thank(v.)”包含两种句式:

“thank(v.)”主动语态句式(A):

img103

图1:“thank(v.)”语料库数据驱动分析句式(主动语态)

注:括号内的第一个字母表示该用法在语料库内的使用频次等级,分A(极常用:20次以上)、B(常用:19—11次)、C(少用:10—6次)和D(极少用:5次以下)四级;括号内的第二个字母表示该用法在该句式内的使用频度等级,分A(极常用:40%次以上)、B(常用:39—11%)、C(少用:10—6%次)和D(极少用:5%次以下)四级。

“thank(v.)”被动语态句式(D):

img104

图2:“thank(v.)”语料库数据驱动分析句式(被动语态)

2)thanks(n.)

表4:“thanks(n.)”语料库数据驱动分析结果

img105

表4的结果提示“thanks(n.)”的句式为:

img106

图3:“thank(n.)”语料库数据驱动分析句式

3)thankful(D)

表5:“thankful”语料库数据驱动分析结果

img107

表5的结果提示:“thankful”的句式为:

img108

图4:“thankful”语料库数据驱动分析句式

3.语料库数据驱动分析结果解读

通过频次比较可以看出,在“科技文献‘致谢’英译教学语料库”中使用最广的仍属“thank类词汇”,次之的是:“grateful类词汇”和“acknowledge类词汇”。较少使用的是:“indebted类词汇”、“appreciate类词汇”和“gratitude类词汇”。

对于“thank类词汇”来说,在“科技文献‘致谢’英译教学语料库”中的句式有以下4个(如表6所示):

表6:“thank类词汇”语料库数据驱动句式分析结果

img109

从表6可以看出,句式(1)在“科技文献‘致谢’英译教学语料库”中属于极常用句式。主语常用词汇是:“we”和“author(s)”,少用的词汇是人名;宾语常用的词汇是人名,其次为组织名和其他成分;宾语后面常用介词“for”,有时也可不用介词。句式(2)在“科技文献‘致谢’英译教学语料库”中属于极少用句式。一般由人名加“be thanked”构成。句式(3)在“科技文献‘致谢’英译教学语料库”中属少用句式。“thanks”前常见的修饰词为“special”,也可用人称代词或不用修饰词。“thanks”之后常不用“be”动词,而直接用介词“to”或“due to”。句式(4)在“科技文献‘致谢’英译教学语料库”中属极少用句式。在该句式内,主语常用的词汇是“we”,其次是“author(s)”,“be thankful”后通常接介词“to”,其介词宾语为人名。

4.语料库数据驱动技术对科技翻译教学的影响

1)教师

(1)改变教师的翻译教学观

传统的教师往往通过内省法来开展翻译教学。这种翻译教学观存在其固有的弊端。以科技文献“致谢”的英译教学为例,笔者在使用“科技文献‘致谢’英译教学语料库”之前曾觉得:属于科技文体的“致谢”,使用“acknowledge”的频率应该比“thank”高(thank属日常生活用词),“thank”一词应常用被动态(常用被动态为科技英语的特点之一),其主语应尽量避免使用“we”(避免主观色彩)等。然而,在使用“科技文献‘致谢’英译教学语料库”之后,才发现笔者内省式的“感觉”与事实大相径庭。

(2)提高科技翻译教学的针对性和有效性

科技翻译教学的时间有限,不可能让教师在课堂上,均衡地讲解每一语言点或面面俱到地分析每一语言点的各个方面。在教学过程中,教师如能借助语料库数据驱动技术提供的信息,培养自己对科技翻译教学语言点出现频率高低之分的意识,便可科学和客观地确定教学的重点和中心(潘璠2000:82)。这样,如何提高翻译教学针对性和有效性的问题就迎刃而解了。

2)学生

(1)学生可迅速掌握目的译语中语言项目应用的整体概貌

对于母语使用者来说,母语语言项目使用频率高低的印象往往由其语言使用经验在头脑中的积累所决定。他们在使用语言时会不自觉地参考潜意识中的信息积累,并支配其语言的使用(雷秀云2000:118)。比如:在讲授科技文献“致谢”的英译时,对于母语为英语的人来说,他们大脑中已通过平时的信息积累,了解到使用最广的仍属“thank类词汇”,次之的是:“grateful类词汇”和“acknowledge类词汇”,较少使用的是:“indebted类词汇”、“appreciate类词汇”和“gratitude类词汇”。然而,对于中国学生来说,他们只有在平时英语语言能力培养上有意识地了解并加强对这方面信息的积累,才能掌握这些语言项目应用的概貌。但是,靠这种方式提高学生的翻译能力,培养过程漫长且效率极低。如果能利用语料库数据驱动技术,对目的译语的一些语言项目频率特征进行统计分析,并将所获结果用于教学,就可让学生直接通过“自上而下”的方式掌握目的译语中语言项目应用的整体概貌。毫无疑问,采用这种方式开展科技翻译教学,对学生翻译能力的提高将起到事半功倍的效果。

(2)为学生选择译语表达手段提供量化等级概念

在科技翻译教学中,经常遇到这样的抉择:在表达同一意义的语言手段中,哪一个更常用?判断的标准是什么?如不借用语料库数据驱动技术,老师很难确定,学生也难以把握。即使老师靠内省法讲述了一些标准,也很难让学生信服。比如:在讲授科技文献“致谢”中“thank”一词的翻译方法时,如何告诉学生该词与助动成分搭配使用的量化等级?老师单靠内省法或简单的观察法,很难给出令学生信服的结论。如果使用语料库数据驱动技术,“thank”一词在科技英语文献“致谢”中,与助动成分搭配使用的量化等级关系随即呈现在学生面前:大多数情况不用任何助动成分;如果用,常用“would like to”和“wish to”,很少使用“want to”。这样,学生在以后的翻译实践中,就可通过量化等级的观点进行合理选择。

(3)为学生提供真实的语料

语料库的最大优点是可提供真实的语言材料,客观地反映出目的译语在现实语言环境中的实际运用。把语料库数据驱动技术提供的语言材料,作为翻译教学实例,比语言学家、语法学家、词典学家、教材编写专家靠直觉编写的例证更直接、更自然、更生动、更真实、更能表现出语言的自然本质。同时,学生也易掌握,并在今后的翻译实践中加以运用。

5.结语

由此看来,普通的科技翻译教师完全可以依靠自己的力量,打破语料库专业机构的垄断,在自己的教学实践中,按照科学的方法自建语料库,并通过网络上免费提供的专业分析软件获得教学中所需的数据驱动信息。笔者撰写本文冀尽绵薄之力,为普及语料库数据驱动技术在科技翻译教学中的应用,抛砖引玉、集思广益。诚然,文中所介绍的方法还有待科技翻译界同仁在日后的教学中共同努力而使其日臻完善。

注释:Giannoni,D.S.在比较英语与意大利语“致谢”体裁时使用了100篇文献建立语料库;Jose,M.在分析医学英语科技文献文体特征时也使用了100篇文献建立语料库。

参考文献

Giannoni,D.S.,2002.Words of gratitude:a contrastive study of acknowledgement texts in English and Italian research articles[J].Applied Linguistics.(1):1-31.

Jose,M.&Marco,L.,2000,Collocational frameworks in medical research papers:agenre-based study[J].English for Specific Purposes.(19):63-86.

雷秀云,2000,基于语料库的学术英语语法的频率特征[J],《上海交通大学学报(社科版)》第1期。

廖七一,2000,语料库与翻译研究[J],《外语教学与研究》第5期。

潘璠,2000,语料库语言学与外语教学思想的转变[J],《外语学刊》第4期。

卫乃兴,2002,《词语搭配的界定与研究体系》[M]。上海:上海交通大学出版社。

杨惠中,2002,《语料库语言学导论》[M]。上海:上海外语教育出版社。

载《中国科技翻译》2005年第4期

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈