计算语言学的发展

时间：2022-04-07 理论教育版权反馈

【摘要】：第14章　语言研究的脑信息学视角：机器翻译自然语言理解又叫人机对话，是"研究如何让计算机理解和运用人类的自然语言，使得计算机懂得自然语言的含义，并对人给计算机提出的问题，通过对话的方式，用自然语言进行回答"。第一代自然语言理解系统分为特殊格式系统、基于文本的系统、有限逻辑系统以及一般演绎系统四个类型。

第14章　语言研究的脑信息学视角：机器翻译

自然语言理解又叫人机对话(Man-Machine Dialogue)，是"研究如何让计算机理解和运用人类的自然语言，使得计算机懂得自然语言的含义，并对人给计算机提出的问题，通过对话的方式，用自然语言进行回答"(冯志伟，2008)。

第一代自然语言理解系统分为特殊格式系统、基于文本的系统、有限逻辑系统以及一般演绎系统四个类型。

特殊格式系统是根据人机对话内容的特点，通过输入特定格式的语言和特定格式的问题来给予特定格式的答案。如1963年Lindsay创建的SAD-SAM系统、1968年Bobrow设计的STUDENT系统、20世纪60年代初期Green创建的BASEBALL系统等都属于这一类型。这些系统是将一些模式化的英语句归纳为一个基本模式，然后由计算机对其进行理解，并针对其中的问题做出解答。由于这类系统对语言格式有很高的要求，因此，它们对语言的句法分析能力往往较差，使用者只能输入非常简单的句子，然而由机器词典通过对单词的识别给出答案。

为了克服格式困难，有些人开始琢磨如何使用文本资料进行机器翻译。基于文本的翻译系统是先将大量的文本信息储存于系统，使用者的所需信息只要不超越文本信息，就能通过检索获得答案。由于基于文本的翻译系统在一定程度上超越了格式的限制，因而使用起来有更多的便利。

后来，人们对文本系统进行了改进，通过把自然语言中的句子用更加形式化的记号进行处理，这样，计算机在对其进行理解时就能进行推理，从而得出较为符合逻辑的答案。由于这些符号本身自成系统，这种翻译系统被称为有限逻辑系统。

自然语言的理解系统还有一般演绎系统，是通过使用某些标准数学符号进行信息表达的系统。如用数学符号表示存在量词，将与x合并就能表示"存在某个x"。如果用符号表示全称量词，那么将与x合并后就能表示"所有的x"。这样，我们就可以使用下列数学符号表达如下句子：

(1) Every student is present．

x (student(x) → present(x))．

由于一般演绎系统能够表达有限逻辑系统不易表达的复杂信息，因而其自然语言的理解力得到加强，在性能上超越了一般逻辑系统。

第二代自然语言理解系统出现于20世纪70年代之后。这代系统开始把自然语言的语义、语境、语用等诸多因素考虑进来，从而使语言本身所表现的多义性、多变性和发展性开始成为机器翻译研究的重要内容。如1972年美国麻省理工学院Winograd创建的SHRDLU是个有手有眼的机器人，他在与自然人的对话中能够将对自然语言的句法分析、语义分析和逻辑推理等能力综合利用，达到理解语言执行命令的目的。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈