首页 百科知识 谁是真正的作者

谁是真正的作者

时间:2022-03-18 百科知识 版权反馈
【摘要】:人们在写作或交际活动中会形成自己的语言风格.这种风格在数量上就呈现为个人的言语在统计特征上的差异.例如,文章中的词长和句长就可代表作者遣词造句的风格.这里所谓的词长,就是单词中的音节数;而句长则是句子中的单词数.有人曾对20位德语作者的22部著作进行平均词长和平均句长的统计分析.在这22部著作中,包含文学、文学理论、哲学、经济学、考古学和自然科学等各种类型.研究发现,平均句长最高的是人文科学和社会
谁是真正的作者_统计中的智慧

人们在写作或交际活动中会形成自己的语言风格.这种风格在数量上就呈现为个人的言语在统计特征上的差异.例如,文章中的词长和句长就可代表作者遣词造句的风格.这里所谓的词长,就是单词中的音节数;而句长则是句子中的单词数.

有人曾对20位德语作者的22部著作进行平均词长和平均句长的统计分析.在这22部著作中,包含文学、文学理论、哲学、经济学、考古学和自然科学等各种类型.研究发现,平均句长最高的是人文科学和社会科学家的著作.例如,马克思的《资本论》平均句长为32.668,而由文学家写的小说、散文的平均句长为17.292,几乎只有《资本论》句长的一半.在全部著作中,马克思的著作,平均句长居第二位,平均词长居第三位.可见马克思是一位善于以长词造长句的作者.由此看来,词长、句长确实是个人文体风格的一个重要标志.

尤勒(George Udny Yule,1871—1951)曾提出一个用于评估不同作家的风格的统计特征的方法.

在一个平面直角坐标系内,以词的出现次数i作横坐标,以频率P(i)为纵坐标,作出P(i)的图形,这个图形被称为尤勒图.通过对不同作者的尤勒图进行比较,就可以对他们的著作中词的统计分布特征得出某些结论.在图16.1中,比较作者A和B的尤勒图可以知道,在作者A的著作中,频率低的词比作者B多,而频率高的词比作者B少.由此可见,作者A的著作中不相同的词比作者B的丰富.因此,对于该语言不太熟悉的读者而言,作者B的著作阅读起来要更加容易一些.

图16.1 尤勒图

使用尤勒图还可以确定匿名文章的作者.其方法是,首先对匿名文章作出尤勒图;然后找出匿名作者的怀疑对象,并作出其相应的尤勒图;最后将这些尤勒图进行仔细对比,如果匿名文章的尤勒图与某个怀疑对象的尤勒图最相似,就可以认为该怀疑对象就是匿名文章的作者.

以上述研究为基础,人们进一步开展了计算风格学的研究,借助计算机技术,运用统计方法深入研究各种文体的特点和不同作者的风格,根据量的计算给出质的评价.人们将计算风格学应用于“作者考证”的研究中,成功地解决了许多令人棘手的困难问题.

1964年,美国统计学家摩斯泰勒(Frederick Mosteller,1916—2006)和瓦莱斯(David L.Wallace),考证出了发表于18世纪末期报刊上的署名为“联邦主义者”的12篇文章的真实作者.作者的候选人只有两个,一位是美国的开国政治家汉弥尔顿(Alexander Hamilton,1757—1804),一位是美国第四任总统麦迪逊(James Madison,1751—1836).这两位统计学家通过对两个候选作者的作品进行统计分析,找到了这两位作者在某些虚词使用上的显著区别:在汉弥尔顿的18篇文章中,有14篇用了enough这个词,而在麦迪逊的14篇文章中,完全不用enough;汉弥尔顿喜欢用upon,而麦迪逊很少使用;汉弥尔顿喜欢用while,而麦迪逊喜欢用whilst.这正是两位候选作者写作时的风格特征指标.

然后,统计学家将这两位候选作者的风格特征指标与作者未知的署名“联邦主义者”的文章中相应的风格特征进行认真比较,最后推断出这位署名为“联邦主义者”的作者就是美国第四任总统麦迪逊.由此了结了现代考据学上的一个公案.

前苏联著名作家肖洛霍夫(М.Щолохов,1905—1984)的名著《静静的顿河》出版后,有人说这本书是抄袭另一个名不见经传的作家克留科夫(федорКрюков,1870—1920)的.1974年,一位匿名作者更是发表了一本书,断言克留科夫才是《静静的顿河》的真正作者,肖洛霍夫至多不过是一个合作者.于是一股怀疑之风又重新刮了起来.在这种情况下,捷泽(G.Kjetsea)等人决定采用计算风格学的方法,对《静静的顿河》的作者进行考证.其具体办法是,将《静静的顿河》4卷本同肖洛霍夫和克留科夫两人的其他没有疑问的著作,使用计算机进行统计分析,以便获取可靠的数据.

他们从《静静的顿河》中随机选取2000个句子,再从肖洛霍夫和克留科夫的各一篇小说中分别随机选取500个句子,组成3个样本,输入计算机进行处理.然后分别从句子的平均长度、词类、各种词类在句子中的位置、句子结构等方面进行统计,并比较分析3个样本的异同.最后得出的统计数据已能充分证明,《静静的顿河》确实是肖洛霍夫所著.可是,由于这是一件世界文学界的大事,捷泽等人非常谨慎,于是写下了一个比较稳健的结论:《静静的顿河》确实是肖洛霍夫的手笔,不过,他在写作时或许参考过克留科夫的手稿.后来,前苏联也有学者对这个问题进行考证,得出与捷泽相同的结论.

1990年5月,前苏联发现了《静静的顿河》的两篇原稿.经过专家鉴定,这两篇原稿均为肖洛霍夫的手笔.至此,《静静的顿河》的作者鉴定这段公案终于得到彻底澄清.

运用统计方法研究《红楼梦》也是一个很好的例子.《红楼梦》是我国一部家喻户晓的古典文学名著,虽然在书的封面上印有曹雪芹和高鹗两位作家的名字,但是,其作者到底是谁,学界一直争论不休.

1980年6月,美籍华裔学者陈炳藻在威斯康星大学召开的国际《红楼梦》研讨会上,宣读了他用统计学研究《红楼梦》作者的成果.他的研究方法和成果引起了人们的关注.

湖南师范大学的一位学者发现,在《红楼梦》的前80回中,丫环、佣人、老妈子等下人都称自己为“小的”,可是在后40回中,却自称“奴才”,用语习惯明显不一样,这说明前80回与后40回可能不是同一个人所写.

1987年,复旦大学的李贤平教授对《红楼梦》进行了风格分析.他将全书的120回作为一个整体,分别统计了47个虚字(之,其,呀,吗,的,是,儿等)的出现频率,作为《红楼梦》各个回目的数字标志;然后用统计方法进行比较分析,得出了许多新的结果:

(1)前80回与后40回之间有交叉.

(2)前80回是曹雪芹根据《石头记》写成,中间插入《风月宝鉴》,还增加了一些别的成分.

(3)后40回是曹雪芹的亲友根据曹雪芹的草稿整理而成.宝黛故事为一人所写,贾府衰败的情景则为另一人所写.

李教授提出的《红楼梦》成书过程的新见解震惊了学术界.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈