首页 理论教育 双音合成词与词组的区分

双音合成词与词组的区分

时间:2022-04-02 理论教育 版权反馈
【摘要】:2.1 双音合成词与词组的区分判定汉语中一个双音组合是不是合成词,并不是一件简单的事情。从共时平面来看,合成词处于词组范畴和词范畴之间,往往同时具有二者的特征。合成词和单纯词之间的划分标准可以明确,而合成词与词组之间则因联系紧密、存在大量过渡现象而难以切分。

2.1 双音合成词与词组的区分

判定汉语中一个双音组合是不是合成词,并不是一件简单的事情。我们知道,语言范畴不是整齐划一、截然相分的,相邻范畴之间往往互相重叠、互相渗透。就范畴本身而言,其中心是突显(salient)的,具备较完整的典型特征,而越靠近边缘,其典型特征越少,范畴的边界是模糊的。对语言范畴进行研究时,工作的第一步,应该把各范畴的中心找出来,进行横向比较,确定各自的位置和特点;然后在此基础上去观察边缘现象,考察各范畴是如何交迭、互相影响的。

尽管在个体区分上仍然会存在一些困难,但双音合成词和单纯词之间的界限在理论认识上是很清楚的:只要双音词内部理据可考,是由两个语素结合而成的,就应认定为合成词;反之,若结合理据丢失而不可考,只能看作是单语素,则应当归入单纯词。

反而是合成词和词组之间有着千丝万缕的联系,其间的区分标准一直困扰着人们,难以判别。汉语中的词和词组这两类范畴之所以难以截然分清,主要原因有二:

一是很多合成词是词组词汇化的结果,合成词和词组之间没有绝对的界线。从共时平面来看,合成词处于词组范畴和词范畴之间,往往同时具有二者的特征。“词与短语之间有一个连续性,复合词处于此连续性之中,一头连着词,一头连着短语,所以既具有词性又具有句法性。”(黄月圆1995)从历时发展来看,词汇化是个漫长、渐进的过程,有不同的阶段,词汇化的程度越低,越是靠近词组范畴,从而具备更多的词组特征;反之,则越趋向于单纯词。合成词和单纯词之间的划分标准可以明确,而合成词与词组之间则因联系紧密、存在大量过渡现象而难以切分。因此,王力先生明确地指出:“词和仂语之间没有绝对的界限。”(王力1953)

二是“词”这个概念具有多维性。到底什么是“词”,可以从不同角度、根据语言学不同门类的需要来加以界定。认识的角度不一致,导致对词的定义和特征分析也大不相同。采取什么视角来讨论“词”,自然会极大地影响到词的判定标准。本书讨论的是汉语词汇语义学方面的课题,因此主要采用的是“词汇词”的视角。也就是说,本书是从词汇语义系统的角度来研究“词”的,本书所使用的词的概念,除非特别注明,一般是指词汇的词。

下面就这两个方面的一些研究作简要的介绍。

2.1.1 “词”的定义

“词”是语言学的一个基本概念。但究竟什么是“词”?如何给“词”下定义?如何将词和其他语言单位区分开来?这些问题一直没有得到很好的解决(1)

对以英语为母语的人来说,“词”作为一个语言单位,它的存在勿庸置疑,因为依英文书写惯例,词与词之间须以空格隔开,这样就在人们头脑里自然形成了根深蒂固的“词”的观念。而在中文里,并没有明确的分词法,词与词是连写的,从视觉上来说,较具独立性的反而是一个个方块汉字。所以,“词”这个概念在汉语圈里迟迟没有形成(2),“字”作为书写单位却被看成语言单位,在很长一段时间里大行其道。汉语作为一个缺少形态曲折变化的语言,没有明显的区分词的形式标记,也是造成“词单位”观念薄弱的一个重要原因。

目前国内比较流行的一个说法是:词是“语言的最小的独立运用的单位”,是“句子所由组成的各个可以独立运用的部分”(王力1953:3)。类似的观点较多,都是从句法分布的角度对词进行界定。国内另有一些学者认为词的本质属性应该从词汇角度来观察,指出“词是一种完备的语言建筑材料”(刘叔新1982)。其实,“词”作为语言的一个基本单位,可以从语言的不同层面、根据语言学各部门的不同需要来加以界定。在语言学文献中,存在“句法词(syntactic word)”、“韵律词(prosodic word)”、“形态词(morphological word)”、“词汇词(lexical word)”、“书写词(orthographic word)”、“社会学词(sociological word)”等概念。人们在语言各模块作用域内对词作了不同的界定。对“词”这个概念在语言学不同部门具体表现,可以参看Di Sciullo等(1987)《词的界定》、戴祥龄《汉语中的句法词、音系词及形态词》(3)、冯胜利(2001c)《汉语“词”的多维性》等文献。

“书写词”是从书写的角度来界定词。例如,在英文中,书写惯例要求词与词必须分写,用空格隔开,所以可以根据这些空格来决定哪些是词,哪些不是词。“社会学的词”是赵元任提出的一个概念,用以与“语言学的词”相对应,指从语用、社会观念的角度进行考察所得到的语言基本单位。在汉语里,“社会学的词”即“字”。

“句法词”是在句法分析中得到的基本单位。也就是说,从句法层面来看,“词”就是“句法规则所能涉及的最小要素”(4),是能够独立占据句法形类空槽(syntactic form class slot)的自由形式(Packard 2000:12)。

从句法角度来定义“词”有着较长的历史。布龙菲尔德把“词”定义为“最小的自由形式”。他在《语言论》中说(Bloomfield 1984:181;汉译本217-218):

……能够作为句子出现的形式,就是自由形式(free forms)。……

……自由形式若不是一个短语,就是一个词。所以词是一个自由形式,但不是全部由(两个或两个以上的)较小的自由形式所组成的;扼要地说,词就是最小的自由形式。

……为了日常生活的目的,词就成了言语的最小单位。

这个定义影响较大,后来很多判定词的操作方法都是根据它提出来的。但是,众所周知,布氏定义存在的最大问题是:根据它的描述,介词、连词冠词等成分都不具备“词”的身份,因为它们不能独立成句。这显然是人们所不能接受的。有鉴于此,人们一般把词“能够独立成句”的说法修正为“能够独立运用(参与造句)”。赵元任提出:“我们不要求词是一个最小的可以单独说的单位,我们只要求它是最小的能够填进某些功能框架的空位的单位。”(Chao 1968:161;中文节译本:86)赵元任特别强调这种测验方法必须有一个前提条件,即被测的形式必须是最小的形式,因为能够填入典型句法功能框架的成分只有下限,没有上限,可以是词,也可以是词组。

“词汇词”(5)是从词汇角度而言的“词”,是存在于词库中的项(item)。需要注意的是,在词汇学和语义学领域,人们严格区分“词(word)”和“词位(lexeme)”。同时,词位(lexeme)和词项(lexical item)作为两种不同的单位,也被区分开来。形象地说,lexeme相当于词典中的词条,lexical item相当于词典中词条下所列的单个义项,只不过是这个义项再加上它对应的词形。也就是说,lexeme和lexical item都是形义综合体,只不过lexical item是单义的而已。

韵律学作为音系学的一个分支,近年来受到汉语学者的高度重视,汉语韵律学以及它与汉语句法、词法的交叉研究得到深入的发展。根据冯胜利(2001b)的总结,“韵律必须视为语言中相互作用的诸多层面里的一个独立的层面”,而汉语复合词的形式标记为音步,也就是说,复合词必须首先是一个由音步决定的韵律词。具体来说,韵律学规定,“韵律词”是韵律层面上的“最小的能够自由运用的语言单位”,而韵律构词学中最小的能够自由运用的韵律单位是“音步(foot)”,所以“韵律词”必须至少是一个音步。汉语的音步是音节音步,因此,“标准韵律词”应该是两个音节。汉语的原始复合词必须是一个韵律词。(冯胜利1997:1-4)

本书是从词汇语义学的角度来考察并列合成词,我们主要根据语义、频次、词汇的系统性来判定合成词。

2.1.2 词汇化学说

(一)现代汉语双音合成词形成途径

现代汉语双音合成词是如何形成的?主要有两个途径:词汇化和构词法。简单来说,上古汉语以单音词为主,随着双音化进程的展开,许多词组或者意义发生改变,语义凝固并单一化,或者其中的成分失去独立性,或者因使用频次较高且符合韵律的基本要求而被人们看作一个整体,这些词组逐渐演化为合成词。这个过程,人们称为“词汇化(lexicalization)”。有的词则没有经历过一个由词组逐渐演化为合成词的过程,它们是按照一定的构词模式直接合成的,我们把这样的词看成是构词法的直接产物。

一般来说,由构词法直接合成的词出现较晚。这是因为,当词汇化具备相当规模,双音合成词大量产生后,形成一定的构词模式,于是可以根据这些模式直接将语素组构成词。这有点像形声字的发展:最初的分化阶段,主要是在字符上添加表义或标音部件,构造新的分化字;当这种形声相合的模式形成一定规模后,就直接把形符和声符拼合起来,批量生产,进入形声字的拼合阶段。但是,也有相当数量的直接构成的合成词出现较早,尤其是同义并列的合成词。在判定词的身份时,我们主要从语义角度进行考察,把语义的概括性和单一性作为重要标准,而同义并列词由于组构成分意义相同,组合后在事实上就已经表示一个完整单一的意思了,因此就必须把它们看作是词而不是词组,它们不必经过一个逐渐凝固的过程。

如上所述,早在上古汉语时期,就有一些双字组合直接成词。同样,即使在今天,虽然在构词法支配下直接构词已成为普遍现象,由词组词化为合成词的变化过程仍在不断地进行。因此,现代汉语中的双音合成词就其形成途径而言其实包括了两类:词化词和词法词。就出现时间先后,则又可以分成两类:“历时传承式”和“现代合成式”,但它们都是按照汉语本身固有模式由固有成分组成的合成词,因此可以合称“本源双音合成词”(王宁1999)。

(二)词汇化及词汇化的阶段性

长期以来,汉语中的双音合成词之所以和词组难以截然分清,有一个很重要的原因是,许多汉语双音合成词是从词组演变而来的。从汉语的历史来看,上古时期单音词占词汇总量的绝大多数,两周时期已经出现了一定数量的双音词,到汉魏晋时形成一个双音词产生的高峰期,双音节词开始在汉语词汇系统占据重要地位。在近代汉语和现代汉语中,双音词已经无可辩驳地取得了优势。据统计,双字组合占《现代汉语词典》条目总数的67.625%(周荐1999)。就语言整体面貌而言,汉语这种从以单音节词为主发展为以双音节词为主的过程,人们称之为“双音化”;就个体语言单位而言,这种由词组变为词的演变过程,人们称之为“词汇化”。词汇化是造成词与词组、语素诸多纠葛的重要原因。

很多学者提出“词汇化”有阶段性,词汇化程度越高,就越接近“词”的原型,词汇化程度低的则介于词组和词之间。看似杂乱的一堆词,有的已经高度词化(例如变成了单纯词),有的还很接近词组,其实正是历时的词化过程在共时层面上的体现。这是难以判断和鉴定“词”的一个重要原因。

冯胜利(1997)从韵律的角度把词汇化过程简要描述为:

短语韵律词———>固化韵律词———>词化韵律词Liberman & Sproat(1992:150-151)把词组的词化划分为三个阶段,其中意义和语法结构是各自独立发生变化的。在第一个阶段,词组获得约定俗成的意义,但保持内部语法结构,同时仍保留词组的特性。第二个阶段,此词组具备约定俗成的意义,保持内部结构,但转而担负起词的语法特性。在第三个阶段,该词组兼具约定意义以及词汇范畴的身份,并且抛弃内部语法结构。

裴吉瑞(Packard 2000)根据词内语法关系的清晰程度以及词义和语素义的关系,在Liberman等人的“词组词化三阶段论”基础上,把汉语双音词的词汇化分为五类:①习约词化(conventional lexicalization)词汇化程度最低,保留了内部语素的语义和语法特性。这一类词与词组的界限有时不太清楚。②隐喻词化(metaphorical lexicalization)使词失去了初始的意义,转化为隐喻意义。又可分为两种:隐喻义发生在词内部成分这个层面的,称为“成分隐喻词化(component metaphorical lexicalization)”;隐喻义发生在全词层面的,称为“全词隐喻词化(word metaphorical lexicalization)”。③失义词化(asemantic lexicalization)指词内部的语法关系可能仍然保留,可以被人们感知,但成分与词的语义关联已经失去。④失法词化(agrammatical lexicalization)指成分和词之间仍有语义联系,但成分的实际语法关系已不易为人察觉。⑤完全词化(complete lexicalization)指构词成分的本来意义已经变得晦暗,语法关系亦不可寻。裴吉瑞主张,在词化过程中,语义和语法并非齐头并进的,而是或先或后,有各自不同的发展速率。一般是语义先发生变化,然后语法信息逐渐消失。正因为如此,他倾向于把上述五类共时层面的词化现象也看作是词化的五个历时阶段(6)

董秀芳(2002)则以动词性并列式双音词为例,把词汇化的进程分为四个历时发展阶段(可以看作是共时存在的动词性并列式双音词词化程度的四个等级):①存在一个相应的单音同义形式,但组成成分不能换序。②不再有同义的单音对应形式。③意义上发生了由具体到抽象或由泛指到专指的引申。④句法功能发生转化。其中第①②个阶段其实就是自由语素的粘着化导致词组词化,即王宁“非自由词素鉴定法”针对的现象;第三个阶段实为“非词源化”(De-Etymologisation)现象,对应着“非词源意义鉴定法”;第四个阶段即对应“非现行语法鉴定法”的第二种情况。这几类现象及相应的处理办法,在王宁1999中有详细的讨论。

现代汉语中的大量复合词是直接承袭自先秦汉语的(马真1981;王宁1996:240-242;1997a)。就这部分复合词来说,我们认为可能存在以下演变阶段:

img4

图2 双音词组词汇化过程示意图

其中,②③④⑤⑥⑦六个阶段正表现了词汇化逐渐递进的过程,最终结果是把词组转化为单纯词。具体而言,它们表示的词汇现象如下:

①词组阶段。两个单音词在句法层面通过句法规则加以组合,构成词组。组合后的意义只是原来单音词词义的简单相加,从意义表述结果来看,往往是事项的简单列举(就并列式而言)。例如“牛羊”等。

②双字组合的整体意义基本等于成分意义的相加,但由于一些特殊的原因,使得这个组合具备了词的身份。比如“鸟兽”,在现代汉语中,其意义也不过是“鸟”、“兽”的相加,但因为“兽”已经变成了不自由语素,只能参与构词,不能直接进入句法结构,所以“鸟兽”只能被认为是一个词,只不过词化程度较低而已。

③组合意义为原来词义的简单概括,概括为一个更为笼统的意义,而不是两个事项的罗列。概括之后,可能产生泛指,意义所指范围扩大。例如,“沐浴”由“沐”和“浴”两个意义相关的语素构成,“沐”本指洗头,“浴”本指洗身,但现代汉语中的“沐浴”并非简单地指“洗头和身体”,而是概括指一个更为笼统的意义,泛指洗澡。

④组合后的意义发生变化,引申出新的义位,但仍与原来单音词词义具有一定相关度。例如“大小”是由两个反义语素构成,但成词后其意义不等于“大”和“小”的简单概括,而是指与大小相关的度量。

⑤组合后意义发生隐喻式变化,意义范畴改变,但保留相似性。例如“奉承”本指“手捧着,手托着”,今指“用好听的话恭维人,向人讨好”,意义变得更为抽象。类似的例子还有“禽兽”、“爪牙”、“心腹”、“天地”等。

⑥词义特征未变,词性发生了变化。一般情况下,是由原来的行为动作、性质状态转变为名物,从动词组合、形容词组合变成名词。例如“乞丐”由“乞”、“丐”二字组成,“乞”、“丐”本来都是动词,都是“乞求”的意思,现代汉语中的“乞丐”已经变成名词,指“乞讨的人”了。也有由名词性组合凝结转化为动词的,如“牺”本指“用来祭祀的纯色的牲畜”,“牲”指“牛、羊、豕”,现代汉语中“牺牲”已经变成动词了。

⑦意义变化较大,原来的单音词词义已被消解,从字面上往往无法判断该复合词的意义。另外,有一部分复合词则是因为书写形式改变了,其理据很难为一般人所认识,难以将该复合词词义与各语素意义挂起钩来。还有一部分复合词,书写形式没有变化,但是其中某个语素或两个语素当初参与组合时的意义在今天已经不用了,只保留在该复合词或少数组合中,复合词词义与语素义的关系处于隐晦状态中,如“物色”。

⑧单纯词阶段。少数复合词在经过长期的演化后,其理据逐渐丧失,即使是专家学者也难以考索其本来面貌。两个音节之间、音节与词之间到底是什么关系,已经无从得知。在这种情形下,只好把它看作单语素,归入单纯词。

有几点需要注意:

首先,并不是所有的复合词都会按部就班地经历所有这些阶段。事实上,复合词的发展是参差不齐的,某个时段共时平面上的词语词汇化程度各不相同。组合的出现固然有早晚先后之分,词汇化程度和该组合经历的绝对时间长短却并不一定成正比。有些组合,虽然出现的时间很早,仍然是词组,或者词汇化程度很低;有的组合则在结合时就已经成词,或者结合时间短而词汇化程度高。这完全取决于词义内部规律以及组合成分在词汇系统中的定位

其次,有的双字组合可能同时呈现出几个不同阶段的特性,具备多种身份。例如“牛马”可以看作一个词组,其意义是“牛”和“马”的简单相加;“牛马”同时是一个词,属于词化阶段⑤的复合词,意思是“比喻为生活所迫供人驱使从事艰苦劳动的人”。

2.1.3 双音词的鉴定办法

如何区分词和词组?人们已经认识到,复合词和词组在语音、语义、语法等方面都体现了差异性:语音上,复合词的重音不同于词组;在语义上,复合词语义专门化;在语法上,复合词的组成部分不可分离,句法规则不涉及词内部结构。但根据这几个方面来区分词和词组,仍然存在困难。(黄月圆1995)

从句法角度来判断“词”的常见测试办法,主要有换序法(permutation)、删减法(deletion)、插入法(insertion)、替代法(substitution)、扩展法等等。例如,莱昂斯提出,词内部成分之间的附着性比词与词之间的附着性要强,可以通过重新排列次序来区分词和语素(例见Lyons 1968:202-204)。克拉托赫维尔(Kratochvil)用删减法来界定词(7)。他把“今天天气很好”这个“最大表达式(the maximal expression)”层层递减为“今天很好”、“今天好”、“天气很好”、“天气好”、“很好”、“好”等六个“中等或最小的表达式(intermediate and minimal expression)”。从而说明“今天”、“天气”、“很”、“好”是词。在国内,王力的《中国现代语法》(1944)和《现代语法理论》(1945)首先提出用插入法来鉴别词组和词。陆志伟1938年的《北京话单音词词汇》使用同型替代法,到了1957年由他主编的《汉语的构词法》中则正式发展出扩展法。前两个方法实际操作起来有一定困难,后一个办法运用较广,但也不全面,例如面对“离合词”它就束手无策。对类似的从句法角度提出的检验方法的具体论述可参看潘文国等1992、 Di Sciullo and Williams 1987等文献。

王宁(1999)提出四种现代汉语本源双音合成词的鉴定法:非自由语素鉴定法、非词源意义鉴定法、非现行语法鉴定法、非语义搭配鉴定法。这些鉴定法结合了语法和语义两个方面,考虑到了历时因素对现代汉语的影响(词汇化的不同阶段在现代汉语共时平面上的不同表现),比较全面(8)

冯胜利(1998)以韵律学的眼光来看“词”和“短语”之分,提出了“右向构词,左向造语”(又称“顺向构词,逆向造语”)的结论。这种区别主要是针对现代汉语中三音节组合而言的。前面说过,韵律词是复合词的必要条件,但不是充分条件,也就是说,复合词必须首先是韵律词,但韵律词不一定是复合词。当然,我们承认韵律对双音复合词形成的巨大作用。例如,他在《古汉语韵律结构与复合词》(9)一文就从历史发展的角度考察了V-V动补式复合词是如何在韵律的制约下从句法结构并缩成复合词,这种研究的视角和方法极富新意。

判定现代汉语中的词即已不易,古代汉语中的词和词组就更难区分。分析现代汉语中的词,还可以凭语感进行变换操作,作出直觉判断。语感判断在古汉语研究中却不能使用,完全要靠语料查检。此外,还有语汇历史发展的因素,给人们的分析研究增添了更多的困难,同一种形式,在同时间层次上,可以是词,也可以是词组。因为受材料的局限,在鉴别先秦汉语中的复合词时,现代汉语研究中惯常运用的“插入法”“扩展法”“替换法”等形式方法以及轻声、变调、停顿等语音标志都难以作为参考。基于这种现实,马真(1980)认为,“划分先秦的复音词,主要应从词汇意义的角度来考虑问题,即考察复音组合的结合程度是否紧密,它们是否已经成为具有完整意义的不可分割的整体。”因此,人们在区分先秦汉语词和词组时,便以词汇意义的整体性、单一性作为判断的重要标准(马真1981;朱广祁1985:151-152;张双棣1989:169;钱光1992;郭锡良1997;等等),同时综合考虑该组合语法结构、词汇意义、修辞表现、见次频率等诸方面的特点(程湘清1992;伍宗文2001:71-142)。我们对复合词的鉴别,正是从意义分析入手,以意义的凝固和概括作为判定的重要指标,同时参考见次频率等因素。当然,从意义角度来鉴定复合词,有时免不了主观性的影响,这是它的局限。但是,这种方法大体上是可行的。

我们在鉴别现代汉语双音词时,采用王宁先生的“本源双音合成词鉴定法”。而当涉及到古汉语双音词判定时,主要采用语义单一鉴定法,即根据双音组合的意义是否凝结单一为主要判定标准。当然,其中会有大量模糊而难以处理的材料,这是由先秦汉语性质决定了的。具体的处理情况,第三章会有详细的分析。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈