首页 理论教育 国外数理语言学研究

国外数理语言学研究

时间:2022-04-01 理论教育 版权反馈
【摘要】:第三节 国外数理语言学研究在国外,数理语言学也是兴起于20世纪50年代左右。1964年,在法国南锡召开并成立了“国际应用语言学协会”。这些都为数理语言学这一学科的建立打下坚实的基础。配价语法在数理语言学研究领域中已经显示出强大的生命力,语料库的建立推动数理语言学的发展,同时它也成为研究自然语言生成规律不可或缺的工具。

第三节 国外数理语言学研究

在国外,数理语言学也是兴起于20世纪50年代左右。1955年以后,美国在许多大学相继开设了数理语言学课程。1957年,日本成立了计量语言学会,西德波恩大学也开设了数理语言学讲座。1958年,苏联莫斯科大学等院校开设了数理语言学课程。此外,法国、英国、罗马尼亚、匈牙利、捷克斯洛伐克、波兰、挪威瑞典以及以色列等国,都先后开展了有关研究。1964年,在法国南锡召开并成立了“国际应用语言学协会”。这些都为数理语言学这一学科的建立打下坚实的基础。任何一门学科的兴起都要有一定的理论基础,数理语言学也是一样,所以我们在了解国外发展状况之前先看一下与数理语言学相关的理论。

一 国外数理语言学的理论依据

(一)理论语言学

随着语言研究的不断发展,数理语言学所涉及和应用的理论也不断地增加、更新,到数理语言学发展的第三个阶段——应用数理语言学时,它运用了很多理论语言学中的原理,这些语法原理大都创立于20世纪50年代左右,它们的引入使数理语言学的研究更具有理据性。这一阶段涉及的语法理论主要有依存语法、配价语法、格语法、范畴语法,它们对数理语言学的应用阶段都有很大帮助,例如语料库的建立、加工,运用统计数学方法分析语言数据。下面我们分别了解一下各个理论的应用情况。

1.依存语法和配价语法

依存语法又称从属关系语法或配价语法,同时配价语法也是对依存语法的发展和完善,它是由法国语言学家特斯尼耶尔于1959年创立。

依存语法从结构主义观点出发,坚持绝对的“动词中心论”。它认为词在句中处于一种相互从属的关系之中,动词是句子的核心,其意义在与句中其他成分的相互联系中得到解释。配价语法不仅坚持结构主义观点和“动词中心论”,而且将价区分为逻辑——语义价和句法价。配价语法认为,每一个句子都包含一个主项(即动词)以及一定数目的属项(主语等)。[16]

法国语言学家特斯尼耶尔认为,句子是一个有机整体,述体动词是句子的中心,具有支配名词词组(行动元)或副词词组(状态元)的性能。行动元的数量决定动词的“价”,他还分出一价动词(只能有一个主语,例如“咳嗽”)、二价动词(可以有一个主语和一个宾语,例如“写”)、三价动词(可以有主语、一个直接宾语、一个间接宾语,例如“给”),配价语法把动词作为句子的核心这一点说明了动词本身的语义特征决定了与之相关的句子结构,当然句子结构也能反映动词的语义特征,由此可知语义特征跟句法关系的联系是很密切的。

语言的真正意义存在于语言的使用中,也就是说只有在交际过程中才能体现语言的价值。语料库是自然语言使用的集合,是语言使用的真实记录者和存储器,能够真实的反映语言现象,克服语言学家观察语言现象时的主观性和片面性。配价语法在数理语言学研究领域中已经显示出强大的生命力,语料库的建立推动数理语言学的发展,同时它也成为研究自然语言生成规律不可或缺的工具。通过对自然语言中各个语言单位在语料库和语境中的关系,我们可以确定每个词的配价特征和配价关系,这些配价关系和特征可以反映语言的深层次结构特征,也可以为研究语言的转换生成机制的建立提供必要的支持。由此可以预见,配价语法将会受到越来越多研究者的重视,为实现机器阅读语言、自动翻译、词典自动生成、人工智能等开辟新的道路。

2.格语法

格语法是美国语言学家菲尔摩于1968年创立的。格语法是一种以语义为主、句法结构为辅的语法,它认为主语和宾语等只是表层中的关系,深层中动词和名词的语义关系则是格关系。格语法在研究句子时是以名词为中心的,它把句子分为命题和情态两部分,命题是由名词和动词的语义关系决定的,情态动词是指动词的时、体、态等。菲尔摩还区分了许多格,有施事格、工具格、给予格、结果格等。

格语法这项理论主要应用于机器翻译中,机器翻译是应用计算机实现从一种自然语言文本到另一种自然语言文本的翻译,要实现对自然语言的翻译必然涉及对自然语言的处理技术。格语法理论在机器翻译系统中的应用做了一些尝试,提出了一种以句法分析和逻辑语义分析巧妙结合的自然处理方法,相对于现今以句法分析为主的语言处理系统,它是一个新的尝试和突破。

3.范畴语法

范畴语法是由著名数理逻辑专家巴尔-希列尔(Bar-Hillel)提出的。在1958年,数学家兰姆贝克(Lambek)在《句子结构的数学》中提出了句法类型演算的理论,根据这种理论可以辨识一个符号串是不是语言中成立的句子。1959年,巴尔-希列尔在《自然语言结构的判断程序》中进一步发展了句法类型演算的理论,详细讨论了自然语言结构的判定程序。由于句法类型是一种范畴,因此,在1960年巴尔-希列尔等在《论范畴语法和短语结构语法》中,把这种理论称为范畴语法。范畴语法力图反映句法类型的语义连锁,采用的是一种构造模式,它尽量设法把语义直接表示于句法之中,其算术上具有透彻性和模型的简明性,因而受到了数理语言学家的欢迎。[17]

(二)索绪尔关于语言和言语的区分

索绪尔在他的《普通语言学教程》中,将语言活动区分成“语言”和“言语”,“语言”是指某个语言社团成员约定俗成的符号系统,它是一种表达观念的符号系统;“言语”是指个人的说话行为,是人们所说的话的总和,即言语行为的进程和言语行为的结果。这是语言学中的一条重要理论。

前面已经说过,运用数学模型和数学程序来研究语言便产生了数理语言学。例如,代数语言学主要研究的是抽象符号,而结构主义所表现出的这种强烈的“形式化”特征很容易地把语法跟数学形式结合起来,也就是说对作为符号系统的语言内部结构运用形式模型进行理论上的分析和描写,或者说研究文法跟语言学的抽象关系,这便是代数语言学(形式语言学)的任务;而对语言交际采用统计程序来处理语言资料便产生了统计语言学。在统计语言学中,“语言”被解释成各种语言成分(例如音素、词、语法形式等)的使用概率的总和,因此它是统计总和;而“言语”则可以看作从统计总和中抽取出来的统计样本,是一种集体选择的结果,每个人独特的说话风格或作品文体则是个人选择的结果,统计语言学试图以这样方法来建立起有关语言系统内在结构理论。

数理语言学虽然产生于20世纪50年代初期,但是其理论基础却受到了索绪尔的“语言”与“言语”区分学说的启发,其发展过程可表述为:语言与言语→语言能力与语言行为→语言模型与统计程序→数理语言学。[18]

由此我们可以看出,索绪尔的结构主义语言理论对数理语言学的产生和发展起到很大作用,如果没有他对“语言”和“言语”的区分,也许代数语言学就不会受到乔姆斯基的转换生成理论的启发而产生于20世纪50年代,有可能出现得更晚。同时,“语言”和“言语”的区分为将数理语言学分为代数语言学、统计语言学以及后来的应用数理语言学提供了理论依据。

(三)计算机科学

1946年第一台电子计算机问世,于是人们把那些复杂、繁琐的工作交给计算机去处理。可以说,电子计算机是促使语言学与数学接近的关键因素。因为,电子计算机是一种信息处理机,而自然语言是信息最主要的载体。电子计算机的研制和发展离不开自然语言的信息处理,自然语言的信息处理也离不开数学。语言学家必须采用数学思想和数学方法来研究自然语言才能回答信息化时代对语言学提出的严峻挑战。

由于电子计算机的出现和发展,数学已经渗透到语言学的领域,并给语言学界带来很多新的想法。例如,乔姆斯基提出了转换生成语法、韩礼德(Halli⁃day)提出了系统语法、兰姆(Lamb)提出了层级语法、派克(Pike)提出了法位学理论、盖兹达(Gazda)提出了广义短语结构语法,这些语法理论都是相当形式化的,就像数学一样严谨。“总之,电子计算机的出现和广泛使用就像催化剂一样促进了数学和语言学的结合,数学渗透到形态学、句法学、词汇学语音学、文字学、语义学等语言学的各个分支,促进了语言学的数学化,这同时也是语言学现代化的一个重要内容,这些内容被概括在‘数理语言学’这个新兴学科中,并得到了迅速的发展。”[19]

计算机的用途在于包括计算、推理在内的思维过程的自动化和机械化。人们为了使用计算机进行中文信息处理就必须编制一套计算机能够理解的语言系统,数理语言学就实现了这一目标。计算机科学理论的介入使数理语言学得到了进一步的发展。

要想了解计算机和现代语言学的关系,可以从两方面来看:一是计算机对语言学的贡献——在信息处理技术上给语言学开辟了广阔的天地;二是语言学对计算机的贡献——在计算机的程序设计、应用上,语言学为其提供了有效的理论基础。计算机刚被人们使用时,主要是用来进行复杂的数值计算、解答数学方程式,可以说,那时计算机的应用范围很窄。但是,自从20世纪60年代以来,计算机的软件和硬件不断更新,这使计算机的应用范围不再局限于数学运算了,它已经扩展到各个领域。但是不论在哪个领域应用,计算机都要接受并执行人的指令,因而人们就必须设计一套计算机能够读懂的语言程序,要想掌握语言程序设计的规律还需要语言学家的帮助,因此计算机与语言学开始了广泛的接触。

计算机语言、自然语言以及其他人工语言有一个共同的特点——它们都是表示一定信息的符号系统。要想使计算机接受人的控制,高速进行逻辑运算和文字信息加工处理等就必须编译一套计算机能够读懂的语言,这一编译系统需要五个步骤:首先是词法分析,其次是进行语法分析,然后是语义分析,接下来是生成代码,最后就是修辞、优化。在计算机自动翻译、人工智能、自然语言理解、语言的信息系统理解方面,都离不开计算机的应用。运用计算机程序系统可以帮助我们更好地处理语言文字,也为数理语言学进一步发展提供科学的理论基础。

二 国外数理语言学的发展趋势

20世纪的重大发明——电子计算机,已经进入了人类文明的各个领域。现代科技对于计算机的使用不仅是进行数值计算,更主要的是进行信息处理,包括巨量的语言文字处理。因而,计算机技术的熟练掌握对数理语言学的研究和发展都起到很重要的作用。人工智能方面的研究主要就是对计算机的应用,人工智能的一个最早目标是自然语言之间的翻译。通常把词对词的机器翻译称为它的第一代,把具有句法分析能力的系统称为第二代,把具有语义分析能力的系统称为第三代。这三代机器翻译系统大致和数理语言学的三个发展阶段相对应,数理语言学逐渐走向成熟也就使机器翻译更加实用,人工智能的核心问题是人机对话,而人机对话的核心是自然语言的理解,也就是要使计算机懂得人类社会的自然语言。但是,在这个问题上,非形式化的传统语言是无法做到的,数理语言学的严密分析方法和形式化的表达手段才是解决这一问题的最佳办法。

当然,数理语言学除了在人工智能方面发挥巨大作用外,中文信息处理也需要应用数理语言学的技术。现代数学的方法和电子计算机将使现代语言学的面貌焕然一新,传统语言学长期采用的枚举方式和例证推理早已显得太琐碎、片面,跟不上现代科学的步伐。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈