首页 理论教育 生成语法理论对机器翻译的影响

生成语法理论对机器翻译的影响

时间:2022-04-07 理论教育 版权反馈
【摘要】:自从计算语言学问世以来,语言学家对句法规则的研究便成为计算语言学家关注的焦点。而Chomsky创建的生成语法理论则在很大程度上为机器翻译发生质的飞跃作出了贡献。在Chomsky自然语言思想的影响下,一批机器翻译研究者开始密切关注Chomsky的生成语言学理论,其中,最受关注的则是上下文无关文法。生成语法中的短语语类改写规则也对机器翻译产生重要影响。

第14章 语言研究的脑信息学视角:机器翻译

如果说词的翻译是机器翻译在人机对话的初级表现形式,那么进行复杂的句法分析,提高机器对句子的理解力则是机器翻译的高级表现形式,它是机器翻译的根本。

自从计算语言学问世以来,语言学家对句法规则的研究便成为计算语言学家关注的焦点。这个时期开发的机器系统在翻译质量上有了质的飞跃:如法国格勒布尔理科医科大学应用数学研究所(IMAG)自动翻译中心(CETA)的机器翻译系统,其中的翻译软件ATEF和ROBRA都能接受对原语单词的词法分析;ROBRA软件在翻译时还能实现句法结构的转换及句法的生成;SYGMOR软件则能先使译文的句法生成以字符链的形式重新输入,然后再提供译文。

而Chomsky创建的生成语法(Generative Grammar)理论则在很大程度上为机器翻译发生质的飞跃作出了贡献。

生成语法又叫生成语言学(Generative Linguistics)、形式语言学(Formal Linguistics),是对自然语言的形式描述。在Chomsky看来,人类语言的外在表述形式虽然千姿百态,但在其底层则无一例外地表现出相同的模式,无论它发生怎样的变化,都始终遵循着人类语言特有的普遍原则(普遍语法),区别仅在于其中的参数不同罢了。因此,从理论上讲,找出各语言间的通用规则,将自然语言中的有限用法投入到无限的使用中去,就能扫清因语言不通而产生的交际障碍。在这一思想理念指导下,Chomsky把对自然语言的解释提升到用形式化描述的高度,认为自然语言的语法就是"对程序设计语言的详细说明",而符号串就是程序。这样,自然语言和程序设计语言就被置于同一个平面上来,从而为自然语言的程序化设计奠定了认识基础。

Chomsky的自然语言思想学说深受计算机语言学者的宠爱,因为将自然语言进行形式化描述符合计算语言学的发展。在Chomsky自然语言思想的影响下,一批机器翻译研究者开始密切关注Chomsky的生成语言学理论,其中,最受关注的则是上下文无关文法。上下文无关文法是指"语法中改写规则的左部是一个孤零零的非终极符号,这个非终极符号在改写规则中与上下文没有关系"独立的非终极符合S或A,右边都是不同于fy的符号串,因而它是个上下文无关文法。" class="calibre11">[1](冯志伟,2008)。

生成语法中的短语语类改写规则也对机器翻译产生重要影响。

我们在第八章详细介绍了Chomsky的短语语类规则。按照这一规则,句子S可以改写为名词短语NP+动词短语VP,NP又可以改写为D+N,VP可以改写为V+NP,其改写式如下:

(2)a. S→NP VP

b. NP→D N

c. VP→V NP

句法结构的演绎操作如同代数式的代入操作一样。如果以(2a)为基础,将(2b)与(2c)依次代入(2a),就会得(3b-d)。

(3)a. S→NP VP

b. S→D N VP

c. S→D N V NP

d. S→D N V D N

如果将含有对应结构的句子"The boy loves the girl"代入(3),就会得(4)。

(4)The boy loves the girl.

将(4)以树形图展示就会得(5)。

(5)

注释

[1]冯志伟曾就Chomsky的上下文无关语法进行过如下描述:

设G={VN, VT, S, P},如果某个结构树符合以下条件,它就是上下文无关语法G的推导树:

(i)每一个节点都有一个标记,这个标记是V中的符号;

(ii)其根标记是S;

(iii)如果节点n至少有一个不同于其本身的后代,并有标记A,那么,A必定是VN中的符号;

(iv)如果节点n1, n2,…,nk是节点n的直系后裔,从左向右排列,其标记分别是A1, A2, …,Ak,那么,"A→ A1A2…Ak"一定是P中的改写规则。

G={VN, VT, S, P}

VN={A,S}

VT={a, b}

S={S}

P: S→ aAS

A→ SbA

S→a

A→ba

由于上述四个改写规则的左边都是一个独立的非终极符合S或A,右边都是不同于fy的符号串,因而它是个上下文无关文法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈