首页 理论教育 计算语言学的发展

计算语言学的发展

时间:2022-04-07 理论教育 版权反馈
【摘要】:第14章 语言研究的脑信息学视角:机器翻译自然语言理解又叫人机对话,是"研究如何让计算机理解和运用人类的自然语言,使得计算机懂得自然语言的含义,并对人给计算机提出的问题,通过对话的方式,用自然语言进行回答"。第一代自然语言理解系统分为特殊格式系统、基于文本的系统、有限逻辑系统以及一般演绎系统四个类型。

第14章 语言研究的脑信息学视角:机器翻译

自然语言理解又叫人机对话(Man-Machine Dialogue),是"研究如何让计算机理解和运用人类的自然语言,使得计算机懂得自然语言的含义,并对人给计算机提出的问题,通过对话的方式,用自然语言进行回答"(冯志伟,2008)。

第一代自然语言理解系统分为特殊格式系统、基于文本的系统、有限逻辑系统以及一般演绎系统四个类型。

特殊格式系统是根据人机对话内容的特点,通过输入特定格式的语言和特定格式的问题来给予特定格式的答案。如1963年Lindsay创建的SAD-SAM系统、1968年Bobrow设计的STUDENT系统、20世纪60年代初期Green创建的BASEBALL系统等都属于这一类型。这些系统是将一些模式化的英语句归纳为一个基本模式,然后由计算机对其进行理解,并针对其中的问题做出解答。由于这类系统对语言格式有很高的要求,因此,它们对语言的句法分析能力往往较差,使用者只能输入非常简单的句子,然而由机器词典通过对单词的识别给出答案。

为了克服格式困难,有些人开始琢磨如何使用文本资料进行机器翻译。基于文本的翻译系统是先将大量的文本信息储存于系统,使用者的所需信息只要不超越文本信息,就能通过检索获得答案。由于基于文本的翻译系统在一定程度上超越了格式的限制,因而使用起来有更多的便利。

后来,人们对文本系统进行了改进,通过把自然语言中的句子用更加形式化的记号进行处理,这样,计算机在对其进行理解时就能进行推理,从而得出较为符合逻辑的答案。由于这些符号本身自成系统,这种翻译系统被称为有限逻辑系统。

自然语言的理解系统还有一般演绎系统,是通过使用某些标准数学符号进行信息表达的系统。如用数学符号 表示存在量词,将 与x合并就能表示"存在某个x"。如果用 符号表示全称量词,那么将 与x合并后就能表示"所有的x"。这样,我们就可以使用下列数学符号表达如下句子:

(1) Every student is present.

 x (student(x) → present(x)).

由于一般演绎系统能够表达有限逻辑系统不易表达的复杂信息,因而其自然语言的理解力得到加强,在性能上超越了一般逻辑系统。

第二代自然语言理解系统出现于20世纪70年代之后。这代系统开始把自然语言的语义、语境、语用等诸多因素考虑进来,从而使语言本身所表现的多义性、多变性和发展性开始成为机器翻译研究的重要内容。如1972年美国麻省理工学院Winograd创建的SHRDLU是个有手有眼的机器人,他在与自然人的对话中能够将对自然语言的句法分析、语义分析和逻辑推理等能力综合利用,达到理解语言执行命令的目的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈