首页 理论教育 上海交通大学科技英语语料库

上海交通大学科技英语语料库

时间:2022-03-30 理论教育 版权反馈
【摘要】:利用JDEST语料库的统计结果来确定大学英语教学的所用词表,使得大学英语教学的词表的数量、范围的确定具有了科学的量化依据。JDEST语料库对于统计学术英语的常用词以及研究学术英语的词汇特征也有一定的帮助。

5.1.2 上海交通大学科技英语语料库

20世纪80年代,我国的国际交往日益频繁,广大科技人员和高校英语教师都迫切地需要掌握英语语言技能,深入地了解学术英语的语言特征,同时国家教育委员会也在积极地推动大学英语教育深层次的改革,具有指导意义的《大学英语教学大纲》的制定就显得尤为紧迫。科技英语语料库的建设就是在这种情况下提出,并加以实施的。上海交通大学科技外语系的杨惠中和黄人杰两位教授早在70年代就在国际学术前沿的语言机器翻译领域进行探索,具备了丰厚的学术积累。在他们的领导下,第一期的交大科技英语语料库JDEST Corpus(Jiao Da English for Science and Technology Corpus)(100万英语词)于1986年建成并投入使用。这是世界上第一个专用英语语料库,被英国伯明翰大学John M.Sinclair教授誉为专用语料库的“先驱”。该语料库是我国建立的第一个大型机读英语语料库。

JDEST语料库的语料全部采自英语国家的正式出版物,涉及电子、化工、电工、机械、航空、造船、冶金、核能、土建和物理等10个具有代表性的科技专业。每个专业平均10万词。语料库由2000个语料单元组成,每个单元约长500个词。语料单元可以是一本书或者一篇篇幅较长的文章中的一个段落或连续的数个段落,也可以是几个类似短文合并组成的文本。全部语料均是在规定的专业范围内通过随机抽样的方法采集的(见表5.2、表5.3)。

表5.2 JDEST语料库中专业学科分类和所占比例

img6

表5.3 JDEST语料库中各种不同语类的采样篇数和所占比例

img7

* 注:其他包括专利、科技广告科学家传记和书信等语类。

JDEST语料库所收录的大多数语料是来自英国、美国和加拿大等英语国家的作者所撰写的发表材料,所占比例约为95%,其中的少数作者是非英语国家的,但是文章是在英语国家的出版物上公开发表的,语料的出版年代以70年代以后的为主,超过总语料的90%。

语料库中的每个语料单元都有各自的检索码,用户可以通过检索码从不同的角度选用自己所需的语料。如果需要研究不同专业的文献在词汇上的差异,就可以让计算机自动对例如V2为代码的航空专业语料与以U66为代码的造船专业的语料进行对比分析。

截止20世纪末,经过语料增补和细致分类,JDEST语料库已经是涵盖文、理、工、医等4个大类,32个专业,库容超过400万词的一个颇具规模的学术英语语料库。

JDEST语料库建成后,对理工科大学英语教学大纲词表的制定、教材的编写、常用词表的制定以及学术英语特征的研究都起到了积极的作用。利用JDEST语料库的统计结果来确定大学英语教学的所用词表,使得大学英语教学的词表的数量、范围的确定具有了科学的量化依据。JDEST语料库对于统计学术英语的常用词以及研究学术英语的词汇特征也有一定的帮助。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈