现代汉语发展和现代汉语翻译语言发展变化的类比分析

时间：2023-04-07 理论教育版权反馈

【摘要】：按照上节所列的三方面内容，我们先实施了词性分布类比分析。此外，能够说明汉语历史变化的在词性上没有可以明确归类的维度。量词这些变化显著的词性通过分类可知，汉语使用频率变化突出的是数量表达形式，所有的数量表达都呈现历时递增的趋势。

按照上节所列的三方面内容，我们先实施了词性分布类比分析。首先，我们先观察了从早期白话文到当代汉语的发展过程中词性分布的状况，被检索的子库为1911年前汉语原创库、1919—1930年代汉语原创库和1990年后汉语原创库(LCMC)。由于词性已经作为标注符号附着于汉语词，我们使用Antconc的Wordlist工具检索到各子库词性的频率。然后根据库容计算出相对频率。为能观察到能说明汉语历时发展变化的词类，我们采用因子分析对能够反映出历时差异的词类进行识别，如果能通过降维得到相关系数的变量并概括出因子则最理想。因子分析结果如下:

7.2.1 词性分布变化

为考察词性在汉语原创文本和汉语翻译文本中的历时变化，我们将词从各个子库中抽出，只留下词性标注。根据这些标注，我们实施了词性频率的统计和词类串的统计分析。词性频率的统计使用Antconc的词统计工具，词类串的统计则使用Wordsmith6中Wordlist工具，在创建的index文件上使用Cluster工具计算2～5词的词类组合。首先谈词性的使用状况。

汉语原创子库中反映出的词性分布历时变化

为观察汉语原创文本在1919年前、1919—1930年，以及1990年后的变化，我们把三个时期子库中各主要词性的分布以频率形式表达出来，然后使用IBMSPSS中的因子分析工具对这些数据进行处理(只提取两个因子；因子旋转时使用最大方差法)，观察这三个时期语言的变化在否在词性上能够反映出来，有哪些词性能够说明这些差异。

表7-2 汉语原创非文学中能反映词性使用历时变化的因子分析

(续表)

图71 汉语原创非文学中能反映词性使用历时变化的因子分析反转图

从表7-2和图71中显示的数据看，有些变量本身数量少，用法固定变化也少，所以没有列入考察范围，如量词素(mg；如“甲、乙、丙、丁”)、时间词素(如朝代、早、晚)和成语。此外，能够说明汉语历史变化的在词性上没有可以明确归类的维度。不过，我们可以根据标记为显著的变量进行归纳、分组，得到以下结果。

与数量表达相关的词:动量、量词素、数量短语、数词、时间量词；

与句内和篇章衔接相关的连词:主从连词、并列连词；

与汉语抽象程度相关的词性:动名、形名；

与汉语构词相关的词性:实义词素、语法词素；

其他词类:介词、动词、副词、叹词、助词、语气词、拟声词、形转副词、人名、地名、时间词、时间词素。限于篇幅，我们只谈量词和连词。

量词

这些变化显著的词性通过分类可知，汉语使用频率变化突出的是数量表达形式，所有的数量表达都呈现历时递增的趋势。数量词使用越来越频繁，这经济发展和生活方式变化有关，这一点无须怀疑。但这一变化还有两个问题不清楚。一是词汇使用具有关联性，如动量词的使用频率和动词、副词的使用频率正相关，分别为9.65和9.74。

这主要是因为动量是量化动作的，而副词是修饰动词或者以动词为中心构成的命题内容的，但动量词和副词本身并没有直接的关系。另一个问题是近一个世纪以来，汉语中的数量短语使用频率在1919—1930年代明显增长，而后又有返低，但变化的幅度不大。值得注意的是，数量短语的使用和助词的使用频率变化呈现相同的趋势，相关系数达到.908，如表7-3所示:

表7-3 汉语数量短语和助词使用频率变化的趋势

数量短语和助词都是汉语常用的功能词，这两个词的相关系数高，意味着使用数量短语时出现“的”的概率高，也就意味着使用数量短语引导的定语在1919—1930年代猛然增加，而在当代，其使用频率又回返到1911前的汉语原创水平。这一现象原因是什么我们还不得而知。值得深入研究。

连词

以\S+/cc\s(\S+/[^w]+){1，}\S+/vn检索后发现，并列连词、介词和动名词的使用频率高度相关并且出现频率呈历时性增长的主要表现是当代汉语中大量使用以下组合形式:

(1)和/cc技术/n援助/vn

而/cc据/p有关/vn方面/n调查/vn

并/cc用/p确定/v的/u数量/n关系/n表示/v了/u这种/r联系/vn

和/cc一个/mq有/v外国/n观察员/n参加/v的/u联合/vn核查/vn委员会/n

儿童/n与/cc环境/n＂/n为/p主题/n的/u＂/n6·5/m＂/n世界/n环境/n日/b活动/vn

这说明，汉语中并列连词的使用频率和vn、p都有关系，或者说，汉语在历时发展中更多将行为动作放在并列短语结构中，这会造成vn使用增多；相应的，v的使用则与cc负相关(-.972)，其原理都是一样的。但动词(v)的使用频率呈现历时正向增长倾向，这是因为，它和动量词(qv)以及副词(d)的使用频率呈现历时增高正相关，表现为变量动量词和副词正相关值高。由此看来，汉语历时变化在词性上表现出系统性。

连词的使用也就具有说服力。在过去的一个世纪里，现代汉语中使用连词呈现以下特征:首先，汉语连词的使用频率总体而言逐渐升高。其次，汉语白话文早期并列连词很少使用，但后来使用频率逐渐增大，到现在已经和从属连词的使用频率相近了。并列连词的使用频率反映出人们思想和表达内容增多，语言更多用来反应各种概念关系。

表7-4 汉语原创文本中连词使用频率的历时变化(每千词)

根据表7-4，从属连词表现出历时变化显著性。在1919年到1960年代的汉语原创文本中，从属连词的使用频率明显高于1911年前的汉语，但到1990年后又出现下降。鉴于从属连词的使用频率和意合性负相关，这是否意味着汉语在经历了较长时期形合努力后又开始回返意合？我们不做这种定论，但这一倾向值得关注、值得进一步观察、研究。

表7-4还显示了并列连词和从属连词使用频率的历时变化趋势不同，幅度也不同。如果并列连词反映句子内部并列成分的使用，而从属连词的使用关系到反映汉语的意合特征，我们就可以说，并列成分使用频率的增加意味着汉语小句承载的信息曾经在1919年后经历过急剧扩充，并在其后且呈逐渐扩充的趋势；与之相比，以从属连词为指标的汉语的意合特征没有急剧的变化，而且，在当代，汉语形合的发展趋势发生反转，已开始转向意合。

动名词

名物化涉及动名词和形容词名物化，形容词的名物化也有显著变化，但总的频率较低，所以，我们不把它列入考察范围。本节只关注另一个重要变化，即汉语中vn的使用。

表7-5 汉语原创语言中动词和动名词使用的历时变化

从表7-5的相对频率上看，在过去一个世纪，汉语原创语言中动名词的使用频率在大幅提升，1990年后汉语中使用动名词的频率是1911年前的近十倍。另一个值得注意的问题是，同一时段内汉语中动词的使用频率在逐渐下降。统计显示，二者呈负相关关系。汉语vn在1919—1930年间使用频率急速跃升应该不是语言内部原因促成，这也需要我们寻求内因之外的解释。

根据以上分析，从词性上看，与1911年前的汉语白话文相比，现代汉语白话文在量词、连词和动名词的使用上发生了明显的变化，且这种明显的变化始于1919年之后。这提示我们，汉语1919年后发生的急速变化不是常规变化，也不可能由内因促成，我们还需要从语言外部寻求解释。

汉语翻译子库中反映出的词性分布历时变化

我们首先对翻译子库(1919—1930英汉翻译子库、1950—1966年、1980年后)的词性进行检索，得到词性频率数据，然后再对词性进行统一排列。排列时使用excel的函数，函数式为:=IF(ISNA(VLOOKUP($A2，$J:$K，COLUMN()-2， 0))，＂＂，VLOOKUP($A2，$J:$K，COLUMN()-2，0))。整理后的数据按照千词的出现的相对频率计算，所得数据由SPSS的因子分析，得到结果如下表7-6所示:

表7-6 以词性为变量的汉语历时变化因子分析

(续表)

从维度上看，第二个因此含有语气词、区别词、名物化形容词时间词等，这类词出现频率并不高，因此，我们不将其列入考察范围，而重点探讨第二个维度。图7 2是反转的二维图:

图72 表7-6的二维图

从反转图中可以看出，汉语翻译语言在功能词的使用上变化明显，主要有连词、介词、方位词和代词，这些词的使用频率的历时变化方式相似:1919—1930年期间频率最高，1950—1966年期间频率降低，而在1980年后频率又开始增高，如表7-7所示:

表7-7 汉语翻译语言功能词使用的历时变化

与此同时，汉语翻译语言中数词和量词的使用频率也呈现相似的变化，但是在1980年后到达最高值。另外一个值得注意的变化是动名词，如表7-8所示:

表7-8 汉语翻译语言动名词使用的历时变化

从因子分析的结果看，现代汉语自1919年以来的变化和汉语翻译中反映出来的变化有不少重合点，主要表现在数量词、连词和动词名物化这三个方面。限于篇幅，我们无法将这些差异深入分析，但这些识别出来的差异为我们进一步探讨翻译对汉语可能产生的影响提供了重要提示:研究汉语在词性上的变化可以主要从数量词、连词和名物化词上考察，而且这些词在使用频率上的变化和汉语翻译语言中反映出来的变化基本并行，说明我们可以从汉语翻译语言中观察现代汉语发展变化的外部原因。

7.2.2 汉译语言形合特征的历时变化

一般认为，英语重形合，多用连接词、介词等连接成分来显示句子成分之间的逻辑关系，而汉语重意合，逻辑关系常常暗含(王力，1943、1945；连淑能，1993)。王力(1945:239)明确指出，汉语传统上连接词数量有限，而介词则几乎没有。也就是说，意合是汉语的常态，很多情况下连接成分是可省的。当然，英语的口语和习语里常常不用连接词，同样，汉语也不乏大量使用连接词的形合用法。值得注意的是，20世纪初的白话文运动以来，随着语言接触的加深，汉语中连接成分的使用更为频繁，在翻译汉语中尤为如此。可以说，如果译本中某一功能性成分的使用频率偏高于常规，则说明其形合程度较高，偏离汉语意合的常规。我们以1931—1949年和1990年以来的文学翻译和原创语言为例，重点考察了连接词和介词这两类频繁使用的功能词，对比分析英译汉文学翻译语言的形合特征及其历时变化，观察源语语言和文化对汉语的影响和干扰，借此考察英译汉翻译规范的历时演化规律。

汉译语言的连接词

汉语的连词是一种具有多层级连接功能的虚词，既可以连接词和短语，也可以连接小句和句子，还可以连接句子和句组(张谊生2000)。连词可以单用，也可成对使用(如“不但……而且……”)，有的连词常常要同“也”、“就”等关联副词搭配使用(“即使……也……”、“只要……就……”)，表达特定的联合关系或偏正关系(参见张谊生2000；刘月华等2001)。

我们采用吕叔湘、朱德熙(1979)对连词的称谓，即“连接词”，检索对象既包括典型的连词，也包括句际的连接成分，例如“换句话说”、“如上所述”等短语连词。根据张谊生(2000:149)，“句际的短语连词在句法上已经虚化，用法上相当于一个词……所以短语连词应该算作连词，尽管不是典型的连词。”有的词既可充当连词，也可充当副词，如“就”一词，表示假设和让步时，其功能为连词(如“你就不说我们也知道”)，表示“立即发生”时则充当副词(如“我一下班就过来了”)。鉴于此，我们仅关注严格意义上的连词，关联副词则不在考察范围内。

总体频率特征

已有学者研究发现，相对于非翻译汉语文本，汉语译本具有多用连接词这一明显的形合趋势(胡显耀，2007；黄立波，2007；Xiao&Yue，2009)。陈瑞清(2005)对汉译科技文本和原创汉语科技文本的连接词进行比较研究，发现译本中最常用的30个连词，出现频率普遍高于原创汉语文本，呈现出颇为明显的形合特征。连词多用的现象在翻译研究领域通常称为“显化”(explicitation)，是翻译语言的一个重要特征。我们对两个时段的翻译语言与原创语言分别进行了比较，表7- 9显示了四个汉语子库中连词的总体频率特征，包括连接词的数量，绝对频率，以及在各子库中出现的相对频率。

表7-9 连接词的数量与频率统计

+:译文连词多用；***:p＜0.001

分析显示，1931—1949年翻译文本共有162个连接词，总出现频率为5506，使用频率为3.41%，明显高于同期原创文本连词的使用频率(1.80%)。同样，1990年以来的翻译文本连接词的相对频率(3.08%)也高于同期原创汉语(2.00%)。对数似然比显示，同时段译文与非译文连接词使用频率有显著差异。此外，两个时段译文中连词的类符数皆多于非译文，体现了译文连接词使用的多样化。总体来说，相对于非译文，两个时段的汉语译文皆多用连接词，呈现明显的形合趋势。

从历时的角度来看，1931—1949年译本的连词的类符数量多于近期译本，连接词使用频率也显著高于近期译本，表明早期译本形合度较高。此外，早期译本与同期原创语言在连接词数量上的差异(162:138)以及使用频率上的差异(3.41:1.80)皆大于近期的对应文本(连词数量差142:138，词频差3.08:2.00)，这进一步说明早期译本较近期译本在连接词使用上变化多，且近期译本更为接近同时期原创汉语的常规特征。

为进一步考查连接词超用特征(overuse)的分布情况，我们进一步提取了两个翻译子库中频率居前30位的连接词，及其在相应原创文本子库中的出现频率，通过对数似然比(log-likelihood)对不同时期译文与原创文本高频连接词的频率差异分别进行了分析。如表7-10显示，两个翻译子库的大多数高频连接词频率皆显著高于其在同时段原创文本的出现频率。

表7-10 翻译子库中频率居前30位的连接词比较

(续表)

+:译本连接词多用；-:译本连接词少用；***:p＜0.001；**:p＜0.01；*:p＜0.05

具体来说，在30个高频使用的连接词中，有28个连接词在早期译本中的使用频率高于同期原创语言，仅有2个连接词在译文中的使用频率相反(可是，只要)，其中25个连词的使用频率有显著差异。同样，与1990以来原创子库相比，近期译本中有26个连接词的使用频率显著偏高。陈瑞清(2005)把此类在汉译文中比原创汉语中明显多用的连接词称作“翻译常用连词”(translation-dominant conjunction，简称TDC)。两个翻译子库中，30个高频连词皆有超过80%的TDC，而这些TDC在译文中的总频率分别占了两个翻译子库所有连词总频率的70%以上。TDC数量及出现频率如此之高，进一步表明了汉译文本相对于汉语原创文本而言更为明显的形合趋势。

表7-11对TDC的分类(连词类别的划分见张谊生2000)可以看出，两个翻译子库主要使用了两类TDC:并列连词和转折连词，这两类连词呈现较多的词汇变化。这说明，两个时段的翻译文本在具体连接词的选择和使用上，呈现出较为一致的选择趋势和词形变化度。

连接词的重合率

我们对译本与非译本子库连词的重合率进行了分析，结果进一步表明，当代译本的连词使用表现出较强的常规化(normalization)特征。

表7-12 译本与原创文本连词重合率比较

此处，重合率用以指译本与相应非译本重合的连词数量占译本连词数量的比例。从表7-12可以看出，1990年以来的翻译文本连接词与同期原创文本连接词的重合率达到76%，也就是说，翻译文本中的大多数连词同样出现在同期原创文本中，这一数值大大高于早期翻译与原创文本的连接词重合率(63%)。由此可见，相对于同期原创汉语文本而言，早期译本连接词的变化度要高于近期译本，近期译本更为贴近原创汉语文本的连词使用特征。

除翻译语言与原创语言的共有词项外，相比同期原创文本而言，1931—1949年期间的翻译文本的专有连接词以正式和古朴的用词居多，如“如其、纵使、如、诚然、乃、再则、于是乎、纵算、甚而至于、如若、乃至、不拘”等，其中，“如其、不拘(不论)”等词已经罕见甚至废弃不用。与此相反，相对于原创文本而言，1990以来的翻译文本的专有连接词多为非正式、口语化的简单用词，如“结果，不是……就是，要不然，就算，要(if)，谁想”等。综上，近期译者倾向于使用更为简单的语言形式，而早期译者倾向于更加正式的文风，较多地偏离了原创文本的连词使用特征。

介词的使用

介词在现代汉语中的主要功能是引导与行为相关的名词短语，共同构成介词短语，通常出现于动词之前，主语或话题之后(Li & Thompson，1981:256；Po-Ching & Rimmington，2004:159)，如下所示:

主语介词+名词短语动词(名词短语)

汉语中的介词在英语中通常也称作“coverb”，因其在句子中往往与动词搭配使用(Po-Ching & Rimmington，2004)。现代汉语中多数介词由动词发展而来，有些介词尚未完全摆脱其动词词源的特征，既可用作介词，也可用作动词，如“在、跟、比、到”等，而有些介词经过发展，已经不能用作动词，如“把、被、对于、关于”等(Li&Thompson，1981:352；朱德熙，1982:174)。

有研究发现，现代汉语经过欧化，出现了新的介词(王力，1943；贺阳，2004)，例如，有些英语介词，如“for”和“to”，在汉语中原本没有对应词，是在语言接触中逐渐产生的(对于、关于)。有些介词则是从早期传统汉语词素借用而来，在原词的基础上进行了结构用法或语义功能的扩展使用，典型的例子包括“在”和“对”。

英语介词较多，一个主要原因是名词结构使用频繁，有研究者甚至认为，英语是“介词性的语言”(连淑能，1993:113)，而汉语是一门“动词性”的语言，在现代汉语中，介词传统上可以省略，其地位是随着以翻译为主要形式的间接语言接触的发展才变得重要起来(王力，1943:503；谢耀基，2001)，这一点从表7-13可以看出:

表7-13 介词的数量与频率

表7-13显示了翻译与原创文本中介词的数量与频率信息。可以看出，两个汉语翻译子库中，介词的相对频率和绝对频率皆高于相应的汉语原创文本，反映了汉译语言较强的形合趋势。然而，词频表显示，四个子库对于高频常用介词的选择趋同。

表7-14 频率居前6位的介词

如表7-14所示，四个子库的前两位介词完全相同，而在前六位高频介词中，有五个介词全部出现在四个子库中(在、把、从、对、给)，只是排名顺序略有差异。在各子库中，前6位高频介词的出现频率占介词总频率的比例皆超过60%，这说明，每个子库的介词使用相对集中，以少数高频介词的使用为主。

从历时的角度来看，1931—1949期间翻译文本的介词使用似乎更为多样化，不仅体现在其介词数量明显高于其他三个子库，而且前六位高频介词的频率在介词总频率中所占比例低于1990年以来的翻译文本，表明该子库的介词使用较为分散，词汇变化度较高。此外，将两个时期的翻译文本分别与同期原创文本相比较，早期译本与原创文本中，介词相对频率的差距(4.46vs.3.18；LL=342.43)也大于1990年以来翻译与原创文本之间的差距(4.46vs.3.63；LL=134.96)(见表7- 13)。

对译本与原创文本介词的重合率分析表明，早起译本与原创文本重合率较低，仅出现于翻译文本的介词多达20个，其中有些较为正式，有些用法在现代汉语中已经少用甚至不用，如“藉、除却、比较”(用法同“比”)等。相反，1990年以来的翻译与原创文本相比，仅出现于翻译文本的介词只有4个。总而言之，从历时的角度看，近期译本介词数量偏少，在介词的选择上更为保守，贴近原创汉语的选择，而早期译本与原创文本差异较大，词汇变化性强，非常规用词较多，且频率大大高于原创汉语文本，体现了更为明显的形合特征。

具体来说，早期译本与原创文本差异最为显著的介词是“在”(LL=176.1；p＜.001)和“当”(LL=126.6；p＜.001)。介词“在”在汉语中最早作为动词使用，与处所词搭配。与英语不同，汉语存在句的主语通常是一个处所词语，处所词前通常并不使用介词，也就是说，传统上在汉语的存在句中，“在”通常是可省的，如:

(2)右边一棵珠兰树下有两个孩子俯在金鱼缸上面弄金鱼。　(《春》，巴金)

(3)屋子的边处没有什么变动，只是磨盘上放着一个黄铜盆，铜盆里泡着一点破布。　(《呼兰河传》，萧红)

“五四”之前，汉语存在句(包括分句和小句)句首的处所词语也并非绝对不可以加上介词，只是这种现象十分罕见。直到今天，汉语的原有习惯依然占据着绝对的优势(贺阳，2004)。然而，据我们观察，该词置于存在句句首的用法在TCT1中处处可见:

(4)在这所丑陋的大厦之前，在它与街心的车辙之间，有一块草地，丛生着牛蒡，茨黎，毒草。　(《红字》，1948)

(5)因为他看见在离他五六十码之处有一队修道士在泥路上游行不曾在雨中下跪致敬。　(《双城记》，1947)

介词“当”用于引导时间短语，表示与行为同时发生，与英语中的as，when， while等从属连词相对应。与“在”类似的是，“当”传统上在汉语中也是可选性介词，然而，由于受英语的影响，该词在汉语中，尤其是翻译汉语中，越来越多地被用在时间成分之前(贺阳，2004)。我们对时间短语“当……时/的时候”进行了索引检索(concordance)，发现该结构在TCT1中出现的频率是OCT1的5倍之多(117 vs.23)。

不仅如此，源语对翻译汉语的影响还体现在这一时间结构在句中出现的位置。传统上，汉语的从句位于主句之前(王力，1945)，但在英语中，时间状语从句的位置比较灵活。而我们发现，TCT1中，“当……时/的时候”结构有多处出现在句末位置，这与该结构的常规用法不符，典型的例子如下:

(6)The company all stared at me as I passed straight among them.　(Jane Eyre)

a:这些人都惊视着我，当我一直从他们中间走过的时候。　(1936)

b:从客人面前笔直走过时，他们全都瞪着我。(1995)

(7)I like your nice manners and refined ways of speaking，when you don't try to be elegant. 　(Little Women)

a:我爱你的端详的举止和文雅的语气，——当你很自然的时候；　(1933)

b:只要你不想装腔作势，我还是非常欣赏你那使人愉快的举止和令人开心的谈吐；　(1999)

(8)He laid his own upon it as he spoke. 　(A Tale of Two Cities)

a:他把自己底手放在医师底手上，当他说话的时候。　(1947)

b:说着，把自己的手放在那只手上。　(2004)

相比之下，1990年以来的译本倾向于将该结构置于句首，符合汉语的常规特征。此外，对原文中as，when等连接词的处理也略不同于早期译本，有的直接省略介词“当”(如例6)，或将其转换为其他类型的状语从句(如例7改为条件句)，或者直接将其提升为与原主句并列的动词短语(如例8)。而早期译本更多地译自原文对等词，试图建立与原文对应的结构，偏离了汉语的常规。

研究结果与讨论

a)汉译语言的形合趋势

在连词和介词的使用上，相比原创文本，两个时期的译文无论是数量还是频率，都呈现出较强的形合特征。前面提到，翻译作为一种跨语言交往行为，不可避免会受到原文的影响。英译汉时，译者会自觉不自觉再现英语的某些形合特征。现以转折类连词“可是”为例，考察它与原文的对应关系。

表7-15显示，“可是”的使用受原文影响明显。在1931—1949年译本中，“可是”共有177例直接译自原文的转折连词或副词，占检索译例的83%。TCT2中，“可是”与原文对应的译例占检索译例的84%，由此可见，源语转折连词对译文中“可是”使用的影响较大，这也是汉译语言形合性较强的重要原因。

表7-15 译语中连词“可是”与源语对应的情况

根据表7-15，除了受英语原文的影响之外，译者还根据上下文额外添加形合词语以使逻辑关系显化。如:

(9)a.Will waited a minute for her to speak and when she did not he picked up the reins.

b.慧儿等了一会儿，想等思嘉开口说句什么，可是思嘉并没有开口，他就把疆绳拿在手中。

(10)a.In understanding，Darcy was the superior.Bingley was by no means deficient，but Darcy was clever.

b.达绥的理解比他更高，可是宾格雷也并不是不行。不过达绥更聪明一些。

Baker(1996)就显化现象指出，在翻译中，译者往往会将各种情况加以详细说明，而不是将含糊不清的地方保留下来。这一点在现有研究中都有论述(Øveras， 1998；Olohan&Baker，2000；王克非，2003；柯飞，2003；秦洪武与王克非，2009；胡开宝，2008；黄立波，2007)。

一种观点认为，显化是包括翻译在内的语言转换的一个普遍倾向，不受源语和目的语差异的影响(Vanderauwera，1985；Olohan & Baker，2000)。也有观点认为，显化研究不能忽略源语影响，应考虑语言间的异同(Kenny，1998:31)。黄立波(2007)将显化现象分为语际显化(interlingual explicitation)和语内显化(intralingual explicitation)，认为从形式化程度较高的语言向形式化程度低的语言转换时，语内显化程度明显高于语际显化。本研究在一定程度上验证了这一观点，表明汉译语言形合程度偏高，主要是源语干扰所致，造成不同时期英汉文学翻译语言的共性趋势。

b)形合的制约因素

从历时的角度来看，早期翻译使用的连接词不仅数量上多于1990年以来的译本，词频也明显偏高，表明早期翻译在介词使用上也更多样化，形合特征更为明显。不仅如此，早期翻译与同期原创文本连词和介词的重合率都较低，有些用法在现代汉语中已经罕用甚至不用，说明早期汉译语言较为偏离同期原创汉语的常规特征。这一差异与当时的社会文化语境密不可分。20世纪上半期，尤其是“五四”前后，中国与西方政治和经济地位的差异巨大，国人深刻感受到政治、文化以及语言的现代化迫在眉睫，这种心理一直持续到三四十年代。

对这种权力关系不平衡的认识直接导致“西化”的文化主张；反映到语言上，则产生了一股“欧化”思潮，翻译成了语言欧化的试验田，旨在吸收西语细密精致所长，补中国白话简单粗糙所短，因而欧化是为表现现代中国人复杂思想感情服务的(胡适，1998)。傅斯年则认为借鉴西洋的语法、文法、词法之长的白话为“高级”白话文，能弥补汉语先天的质直、干枯、贫乏之短，欧化是使汉语新生的必由之路(傅斯年，1919)。基于这一认识，带着改造白话文使命的直译方法开始大行其道，与欧化正相辅相成(王克非，2002)。这种带有明确目标的间接语言接触扩大了英语对汉语的影响，汉语的形式化趋势一时高歌猛进，打破了长期稳固的汉语意合传统，冲击了当时的汉语语言规范。但这种冲击只作用于书面语，汉语口语的意合特征并没有因此受到明显的影响。继之而来的“大众语”运动反思了这一汉语改造思潮，强调大众言语方式才是可资参照的汉语规范，即“大众说得出，听得懂，写得来，看得下的语言”(陈望道，1934)。可以说，汉语发展的这一方向从20世纪30年代后期已形成共识，与文体相关的温和的形合趋势已成为汉语演化的调节机制，汉语翻译语言的形合特征历经这种调节机制的扬弃，发展成当代文学翻译语言的规范，其形合性弱于现代白话文草创初期就不言而喻了。由此可见，原创汉语对翻译语言的制约，在语言自身发展过程中，对于引发语言自我调节功能的作用不可忽视。语言内部机制在正常运转过程中，对于语言使用者具有某种强制性力量，能够自动过滤使用者的语言选择。

7.2.3 语块(lexical bundle)和词性框架(POSframe)的历时比较

语块

对汉语词构成的块使用Word Smith进行统计，对比由2～5个词构成的词块表，获得Keyness数据。由于数据都是两两比较，为了更直观展示汉语发展在词丛上的表现，我们分阶段呈现对比数据；此外，受篇幅所限，无法呈现完整的keyness数据，我们就截取Keyness正值和负值两端各20项Keyness值呈现并展开研究。

现代汉语成型时期(1930年前)，如表7-16所示:

表7-16 1919—1930年汉语原创语言vs 1919年前汉语原创语言

(续表)

从keyness值看，相对于1911年前的汉语原创，1919—1930年代的汉语原创中有下列表达形式明显高频使用，主要有①修饰成分如:她的、他的、新的；②带修饰标记的组合，如:的话、的眼光、地说；③连词:只有、只是；④数量短语，如:一个人、一天、一种。

那么，这些变化是否和翻译有关呢？我们把1919—1930年汉语翻译语言和1911年前汉语原创语言词丛进行主题词对比，结果如表7-17所示:

表7-17 1919—1930年汉语翻译语言vs 1911年前汉语原创语言

(续表)

对比发现，1919年后汉语中使用频率明显提升的组合形式有不少在同时期的译文中都已出现，而且，1919—1930年代汉语译文中这些词的使用频率也同样大幅高于1911年前的汉语原创。①修饰成分如:她的、他的；②数量短语，如:一个人、一天、一种。另外，与否定有关的情态在数据上看应该和翻译有关，如表示强调或者确切否定的“并不”，还有表达不确定的“不会”。当然，仔细观察我们就会发现，连词使用的突然变化(只是、只有、还是)不是由汉语翻译语言引致的，如表7- 18所示。这说明，不能把汉语中各种组合使用频率的急剧增大视为受翻译影响，使用多段多源数据对比分析有助于我们对比做出较为准确的判断。

表7-18 1911年前汉语原创、1919—1930年汉语翻译、1919—1930年汉语原创词丛对比

(续表)

如果说，汉语在1919—1930年代较1911年前的白话文发生了显著变化，那么这种变化是否具有延续性呢？下面的统计涉及1990年汉语原创语言和1919年前汉语原创语言，统计显示，汉语在1919—1930年代发生的重要变化大都延续下来，已经成为汉语中稳定的语言表达形式了，如表7-19所示:

表7-19 1990年汉语原创语言vs1919年前汉语原创语言

(续表)

词性块

上节考察了语块的分布，统计显示汉语在物主性修饰成分使用更为频繁，主要表现为代词和“的”的组合更为频繁地使用，还有连词和数量短语的高频使用。但这只是反映了常用组合形式的历时变化，汉语在句子局部结构上的变化很难通过词组合反映出来。为此，我们尝试将词性单独处理，根据词性的组合观察现代汉语早期在词类组合上发生的变化，由此尝试推断可能的变化是否与翻译有关。我们判断变化的依据还是频率，变化的显著与否还是以主题值和P值为依据。观察时使用Word Smith6生成子库token index，通过对比任意两个子库的Clusters(2～5个词性赋码串)得到高差异值(Keyness)，根据高差异值的大小依次呈列语块。

为考察1919年后现代汉语的变化，以及翻译在其中可能扮演的角色，我们分别对比了1919—1930年汉语原创和1911年前汉语原创的词性赋码串，以及1919—1930年汉语翻译和1911年前汉语原创的词性赋码串。共得到两张对比表，分别为附表1和附表2。

这两张表太长，也难以在本项研究中列出并分析。我们暂时呈现出来，以供参考并为后续研究做好铺垫。不过，我们还是将原创词性赋码串的前500项析出，并将1919—1930年的汉语翻译与1911年汉语原创的词性赋码串高差异值合并，形成第三张表。1919—1930年原创vs1911年原创词性框架高差异值分析和1919—1930年汉语翻译vs1911年前汉语原创Keyness分析见附表1和附表2。表7-20呈现的是1919—1930年汉语原创及汉语翻译与1911年前汉语原创的比较。高差异值是指1919—1930年汉语原创和1911年前汉语原创的对比值，全部比较值见附表3。

表7-20 1911年前、1919—1930年汉语原创及汉语翻译语言可能关联的数值(节选)

(续表)

汉语词串和词性赋码串的对比分析说明，现代汉语在1919—1930年代发生了显著变化，其中的许多变化在汉语翻译语言中可以找到。从词串角度看，汉语发生的重要变化表现在“代词的”、“连词”、“的”等修饰成分的使用；从词性赋码串角度看，汉语在这一时期的变化多以助词(u)的使用有关，也与动名词(vn)的使用相关，其中可能包含的句法信息有待于我们进一步探索和研究。

7.2.4 结构容量的历时对比

汉语是结构封闭型语言，汉语句子对结构的容量十分敏感(王克非、秦洪武， 2009；秦洪武，2010；Wang & Qin，2014)，容量大小直接关系到信息处理的难度和效率，是汉语的重要结构特征。但长期以来，我们对汉语结构容量的构成机制所知甚少，也不太清楚它的历时演化过程；由于认识不充分，其发展和变化的趋势就难以把握。

鉴于此，本项研究基于语料库，尝试通过类比分析找到汉语结构容量扩增的主要语言手段，并分析汉语语言结构容量的变化过程和原因。

汉语结构的容量和信息处理

语言是线性的，言语中使用的词一个接一个串在一起，相互之间根据线性特征构成各种关系(Saussure，1987:121)。线性特征决定了语言需要按照横向组合规则组织言语表达，语言之间的异同在很大程度上可以从体现这些规则的语言手段上反映出来。比如，表达限定关系时，汉语只允许限定成分出现在被修饰成分之前，因为汉语没有后置的语言手段；而英语可以利用关系代词、分词短语、介词短语等语法手段将修饰成分后置，呈递归性的开放状态。

a)汉语结构的容量

修饰成分前置与汉语结构的封闭性有关:就小句而言，最靠右的成分(除句末助词外的宾语或者谓语)通常为结构的终点；就短语来说，偏正结构中的“正”将结构闭合。因此，与英语不同，汉语是结构封闭的语言；结构封闭才有容量过大或过载的问题。汉语的封闭结构涉及内容较多，但最活跃的当属介词**2方位词结构、数量词名词结构和指示代词名词结构，本章就探讨这些封闭结构。

探讨汉语翻译语言时，过长的句子和复杂多样的句式通常是关注的内容(王克非，2002)，关注的焦点大都是封闭结构的容量。余光中(1984:748 749)曾指出，一些公式化的翻译体(如“当……的时候”)“在中间夹了那一长串字后，两头远得简直要害意思”，这种现象就是指汉语封闭结构有容量过载的问题。但到目前为止，我们对于汉语长句的认识主要停留在线性字串的长度上，很少顾及其内部构成以及句法复杂程度，而这些更能说明其容量和性质。

b)结构容量与认知处理

在语言学文献里，尾重(end weight)的计算比较直接，词的数量越多，句法单位就越大，也就更“重”。一般情况下，如果长度是一个句法单元支配的词的数量，那么，该单元所含的词的数量和句法复杂程度成正比(Szmrecsányi，2004)，但长度增加并不意味着句法复杂程度必然加深。因此，我们一方面要以字串长度为线索考察句法程度，同时又要考察字串本身的句法构成特征。

句法结构不只是形式现象，它还是一个心理现象，因为说话者需要根据自己的目的和偏好构建、产出与这些句法规则一致的语言材料。Szmrecsányi(2004)提出的句法复杂性指标(Index of Syntactic Complexity)将可以识别的语言使用特征和认知处理联系起来，他基于Beaman(1984:45)和Givon(1991)的研究，将从句(SUB，that)和各种内嵌成分(WH，which)列为句法复杂度指标。这一做法在英语里没有问题，但汉语里行不通，因为后者没有从句和内嵌小句的语法手段，但汉语存在带有“的”标记的前置定语(如“来到这个曾经听得那么多的地方”)。这提示我们，“的”字结构兼具that(SUB)和WH两种成分的功能，汉语也存在可用的语法标记。

那么，句法复杂度和可读性有什么关系呢？Givon(1990:10)认为，语言学上的句法复杂程度(syntactic complexity)和心理学家描写的认知复杂性之间有关联，如:

(1)编码:心理表征的事件越复杂，编码它的语言的句法结构就越复杂。

(2)处理1:心理表征的事件越复杂，要求的心理处理运算就越复杂；因此，

(3)处理2:句法结构越复杂，需要的心理处理运算就越复杂。

根据这三个假定，句法的复杂程度和处理努力之间呈正相关关系。那么，从跨语言角度看又该如何呢？由于语言的组织方式不同，同一个复杂的事件在不同语言中的组织方式完全可能存在差异。如:

(11)a.第一辆车的汽车夫轻声地对坐在他旁边的穿一身黑拷绸衣裤的彪形大汉说:

b.The driver of the first car said in a low voice to the hulking fellow sitting beside him in black silk:

(11a)中作定语的动词短语“穿一身黑拷绸衣裤”在(11b)中表达为介词短语(in black silk)；而“坐在他旁边的”与“sitting beside him”句法位置各异。显然，源语和译语对应成分的句法范畴或位置不一致。但这只是表层差异，更重要的是二者在语感上不同:汉语的前置修饰语要比对应的英语修饰成分拗口。进一步说，汉语(11a)过度堆砌前置修饰成分，不是汉语典型表达方式；而英语译文使用多种手段避免前置，自然流畅，合乎常态。

既然信息的复杂性、句法复杂性和处理努力对应，那么，表达相同的事件语义信息的源文和译文也应该付出相同的努力。例(11)提示我们，情况并非如此。这促使我们思考汉语结构本身的容量、结构复杂性和长度问题。

研究思路和方法

a)研究思路

结构内部所含的词数和结构复杂性和容量成正比，而且，结构越一致，越容易处理。我们对汉语结构容量和内部构成的描写就基于这一假定。

结构内部成分的复杂性与长度关系密切，但又有区别。长度指字串的数量，复杂性主要指成分本身的句法复杂程度，如小句比词汇复杂，内嵌其他成分的修饰语比单个修饰语复杂。因此，结构内部字串长或修饰成分多不一定导致结构复杂或可读性降低。如:

(12)他是中国第一个能跑、能跳、能投、能盖帽以及能参与快攻的全能中锋(LCMC[1])

(13)只要得个相貌端正、性情贤慧、持得家吃得苦的孩子，(1911年前)

看来，长度并不直接关联可读性，因为后者可以通过节奏感强的平行结构得以保证。所以，观察汉语结构内部的构成应是多维的，不宜破其一点不及其余。

b)研究方法和数据

观察汉语结构容量在字串长度和结构复杂性上的历时变化，需要提取主导这些变化的主要语言因素。为此，本章基于类比语料分析翻译语言与汉语历时变化之间可能存在的互动关系。本研究使用的类比历时语料来自表7-1。

根据表7-1，构成类比的语料库为汉语原创语料库(单语语料)和汉语翻译语料库(双语平行语料)。汉语原创库由多个子库构成，其中的LCMC是肖忠华建设的兰卡斯特现代汉语语料库，其他3个子库为新建语料库。汉语翻译语料库由4个子库构成，分别为:1919—1930年英汉翻译子库、1935—1949年英汉翻译子库、1950—1966年英汉翻译子库、1980年后英汉翻译子库。这4个子库和汉语4个子库中的后3个子库在时间上基本平行，这样有助于进行类比分析。

c)结构内部构成成分的提取

我们根据句段(以句号、逗号、冒号、问号、分号为切分标记)来提取结构内部的构成成分。汉语的多词句段(不同于“可是”、“但是”等)一般是封闭的，封闭结构可以在句段末，也可以在句段中(如“他们在明亮的教室里学习”中的下划线部分)。我们使用语法标注语料，根据词性提供的线索按照词串数量提取封闭结构。具体步骤如下:①提取封闭结构，观察较大容量结构的内部构成；②探讨汉语结构容量扩增的主要语言手段；③参照汉语翻译语言观察汉语结构容量历时变化的形成原因。

提取封闭结构时，我们自行编写了脚本程序，提取使用下面的命令:

if($line=～/((在｜从｜自从｜向｜往｜自｜于)\/p\s(\S+\/[^w]\s){1，9}\S+\/[f｜nd])｜(\S+\/[m｜r]\s\S+\/q\s(\S+\/[^w]\s){0，9}\S+\/n)｜((当｜在)\/p\s(\S+\/[^w]\s){1，9}(时｜时候｜光景｜时期)\/[a-z]+)/){#匹配含有符合条件的行

该命令旨在一次性提取汉语“介词方位”、“数量短语”、“介词时间”结构，提取出的结构自动存入Excel，人工删除不符合条件的索引行，得到的结果供下一步分类分析。

汉语大容量结构的内部构成

结合语料检索得到的结果，本节先分析现代汉语结构容量的历时变化，然后分析其内部构成特征，并将分析结果与翻译语言进行类比分析。

检索出封闭结构后，在 Excel中使用函数式“=LEN(B2)-LEN (SUBSTITUTE(B2，＂v＂，))”计算每个单元也就是每个封闭结构中动词标注v的数量，得到结构内部词性。按照这种方法我们依次得到了形容词(a)、“的”和连词(c)在每一条封闭结构中出现的频率。本次统计没有将出现频率最高的名词列入观察对象，主要是因为它是封闭结构的必备构件，不需要使用相关分析来观察。

a)汉语原创

得出上述四类词在不同长度封闭结构中的分布数据后，我们开始运用回归分析，尝试观察以上4个变量在不同长度封闭结构中的分布情况，并观察这些变化与长度变化相关的程度。为尽可能反映时间和语域对汉语结构容量构成可能产生的影响，我们分4个时段，每个时段将文学和非文学分开统计，得到的标准化相关系数如表7-21所示:

表7-21 1911年前汉语原创文学封闭结构容量扩展手段回归分析

表7-21显示，1911年前汉语白话文初期，文学原创中扩展封闭结构容量的最主要手段是“的”字短语，其次为动词。相对而言，较少使用连词。同时期的非文学也有相似的特征。但动词和连词与结构容量的关联度已经增大，如表7-22所示:

表7-22 1911年前原创非文学封闭结构容量扩展手段回归分析

这种状况从1919年后开始改变。非文学和文学之间在封闭结构构成上开始出现明显差异:非文学中动词开始占主要位置，连词在容量扩展中的作用也明显升高；与之形成鲜明对比的是:同一时期文学子库中四类词与结构容量的相关系数按照高低依旧是“的”字、动词、形容词和连词，如表7-23所示:

表7-23 1919—1930年原创非文学封闭结构容量扩展手段回归分析

这说明，1919年后，汉语结构容量扩展手段的变化首先反映在非文学语言中，动词和连词开始更频繁地用于扩展结构容量，这也意味着扩展了的结构容量中会较以前更多地使用动词短语、小句以及并列或者从属成分。但是，即使到了1919年后，文学创作文本中结构容量的扩展手段在位次上依旧没有变化，说明，文学创作语言中扩展结构容量的手段变化比非文学文本中来得缓慢，如表7-24所示:

表7-24 1919—1930年原创文学封闭结构容量扩展手段回归分析

到了1950年后，汉语封闭结构的容量扩展手段在文学文本里没有变化，但在非文学文本里有变化。除了“的”字结构的使用有变化(变化很小，可以不计)，比较明显的变化是连词的相关系数开始高于形容词，这也意味着汉语非文学文本中结构的复杂程度也处于增加之中，如表7-25和表7-26所示:

表7-25 1950—1966年非文学原创封闭结构容量扩展手段回归分析

表7-26 1950—1966年文学原创封闭结构容量扩展手段回归分析

在1990年后的非文学文本中，容量扩展的主要手段动词处于最高位置，连词已经成为比形容词更常用的容量扩展手段，如表7-27所示:

表7-27 1990年原创非文学封闭结构容量扩展手段回归分析

在同时期文学文本中，“的”字结构依然是容量扩展的主要手段，但连词开始比形容词在容量扩展的手段中稍占优势，如表7- 28所示。这是长期以来未出现的状况，值得注意。

表7-28 1990年后文学原创封闭结构容量扩展手段回归分析

四个时期的分析表明，汉语结构容量扩展的主要手段呈现以下变化特征:首先，文学和非文学由最初的无明显差异到明显存在差异，文学中“的”字作为主要的容量扩展手段延续至今，非文学中使用与动词相关的表达形式业已成为主要的结构容量扩展手段；其次，连词在封闭结构中的重要性逐渐上升，动词在非文学语料封闭结构中的相关性自50年代后逐渐加大。再次，汉语在结构容量扩展手段上的变化先从非文学文本开始，文学中封闭结构容量的扩展变化较小，较明显的变化体现在连词使用上，连词逐渐成为和形容词相当的容量扩展手段。

b)汉语翻译语言

汉语原创语言在容量扩展手段的使用上既有承继又有变化，在文学文本中承继表现得最为突出，这种状况在汉语翻译语言中是否存在呢？另外，汉语原创语言中使用的扩展手段比较明显的变化是连词，它在非文学文本中由最初的最低频使用的手段逐渐变成高于形容词的扩展手段。那么，这种变化有没有外来影响的可能或者依据呢？我们可以通过类比分析对此进行观察。先看前三个时期的统计表，如表7-29至表7-34。

表7-29 1919—1930年翻译文学封闭结构容量扩展手段回归分析

表7-30 1919—1930年翻译非文学封闭结构容量扩展手段回归分析

表7-31 1935—1949年文学翻译封闭结构容量扩展手段回归分析

表7-32 1935—1949年非文学翻译封闭结构容量扩展手段回归分析

表7-33 1950—1966年非文学翻译封闭结构容量扩展手段回归分析

表7-34 1950—1966年文学翻译封闭结构容量扩展手段回归分析

这三个时期的统计显示，汉语文学翻译和汉语文学创作在结构容量的扩展手段的使用频率上没有变化。但在连词的使用上变化较大。在1935年后的非文学语料中，连词开始超过形容词的使用频率，成为比形容词更重要、使用频率更高的结构容量扩展手段。值得注意的是，自1919年开始，连词作为结构容量扩展手段在汉语非文学语言中的重要性已经和形容词相当，这可能也是同时期汉语原创非文学语言较多将连词用作容量扩展手段的一个原因。

1980年后的表7-35和表7-36显示，汉语文学和非文学翻译语言结构容量扩展的方式还是在“的”、“动词”、“形容词”、“连词”的使用上延续这种差异，看以看出，“的”字结构和形容词的使用呈现出正向的关联，同样，动词和连词也呈现正向关联。

表7-35 1980年后文学翻译封闭结构容量扩展手段回归分析

表7-36 1980年后非文学翻译封闭结构容量扩展手段回归分析

值得注意的是，上述词、词性之间的关联在1911年前的汉语语言里并不存在，是1919年后才出现并在汉语中稳定下来。这种关联性在汉语翻译语言中表现得最为稳定，说明汉语在容量扩展中多用动词就会多用连词，结构就越复杂；多用“的”字就可能多用形容词，意味着汉语描写和渲染气氛的手段长期以来没有明显变化。

分析显示，现代汉语经历了结构容量的扩展过程，结构内部成分变得复杂，构成大容量结构的成分主要有非平行性多重修饰成分、小句性定语、内嵌性定语、多动词短语、介词短语，等等。值得注意的是，上述变化缺少继承性，亦非渐进变化，而是在新文化运动之后发生的急速变化，与当时知识界在翻译、写作和语法研究等方面大量模仿、借用外来成分密不可分。结构内部容量扩展就是在这一时期集中出现并在汉语中逐渐稳定下来。可以说，是翻译引发汉语结构内部构成的急速变化。但需要指出，汉语只是选择性地接受翻译语言的影响；而且，翻译语言中的“欧化”并非严格意义上的语言西化，许多前置成分在线性关系上与欧语并无关联，只是过度利用了汉语本身的结构张力而没有充分调用汉语的表达手段。因此，汉语自身的表达规律和表达手段应该进一步挖掘、利用并得到尊重，这样才能把握好汉语发展的方向。

语料考察和分析表明，汉语翻译语言有以下特点:①汉语翻译语言高频使用的单音节词较原创文本少；②汉语翻译语言大幅扩展了汉语结构的常规容量，导致句子偏长；③汉语翻译语言里的介词、连词和代词在使用的数量和频率上远远超过汉语源语文本；④翻译语言完全可能使用原创文本不太常用的词和多词组合形式，因此不能简单地认为原创文本在词汇运用上不如目的语文本丰富。

需要指出，汉语翻译语言本身的特点并不支持翻译共性。首先，翻译语言虽然用词不丰富，但句子过长，因此不能体现翻译语言共有的简化特征；其次，汉语翻译语言局部的外显化与一些词项(如关系代词、逻辑连接词、代词等)的隐含并行，外显化可能只是局部特征；再次，汉语翻译语言过度使用目的语中某些词(素)的组合能力，且结构容量增大，因此也不支持规范化。从这个意义上说，翻译共性或许只是特定语言间的语言转换现象，或是翻译语言的局部特征，不应是所有翻译语言共有的属性。

[1] 文中LCMC指兰开斯特大学现代汉语语料库；GCEPC指北京外国语大学通用汉英平行语料库(该库包含1940年后的双语语料，本研究只使用1980年后的英汉翻译语料)；“1911年前”指1911年前汉语原创子库。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈