首页 理论教育 离散分布原理

离散分布原理

时间:2022-03-04 理论教育 版权反馈
【摘要】:这便是情报分布中出现马太效应的根本原因。由上分析可知,布拉德福定律揭示的不仅仅是情报的离散分布,同时又揭示了离散分布基础上的集中取向和核心趋势,它所创造的频次-等级排序方法和对马太效应的深刻解释都具有普遍意义。

10.1 离散分布原理

信息、知识和情报是以离散形式分布的,在离散分布基础上趋向集中。由于信息、知识和情报的离散分布是绝对的、复杂的,所以我们才需要研究如何用科学的方法获取情报密度最大的情报源,为用户情报需求提供最优服务。它实际上主导着整个情报活动,对情报分散规律的研究也将揭示情报学具有奠基性的定律。

信息、知识和情报的离散分布表现为其内容单元以不同的方式从不同的角度分散于各种著作或不同形式的载体中。情报的离散分布具有复杂的机理,本质上是由知识体系自身的分化和综合决定的,与情报的生产、利用,情报的累积性、再生性、老化性以及对创造者的独立性有密切的关系。情报的离散分布现象是全部情报活动的基石。迄今对情报离散分布现象研究最负盛名的成果便是我们大家熟知的布拉德福(Bradford)定律,该定律研究和揭示了相关论文在科学期刊中的集中分散现象,被公认为是情报学的基本定律,它与描述科学生产率分布的洛特卡(Lolka)定律,词频分布的齐夫(Zipf)定律,文献增长老化的指数定律具有共同的渊源和机理。

布拉德福定律在研究中创造了一种重要的方法,即频次—等级排序法(freqence-rank):按某一具体事项(如文章、作者、词等情报单元)在其主体来源(如期刊,作者集合或词的集合)中的出现频次按递减顺序排列起来,就会导出布拉德福分布。这种分布不仅仅存在于文献情报领域,在许多其他领域,尤其是在社会科学领域内更是一种常见的分布现象,如城市按人口的分布,居民收入多少的分布,书籍按页数的分布,生物的属按其种的分布等等。只要我们将主体来源按某一具体对象出现的频次排序,就可以得到类似的分布。布拉德福发布的特点在于我们所考察的具体对象(如文献单元)的大多数集中于少数主体来源。如某一主题的科学论文约三分之一集中在少数期刊上,而其他三分之二分散在大量期刊上;大多数作者一生只能发表一至二篇文章,而为数不多的一些作者却成果累累,一生发表几十篇甚至数百篇文章;人们写文章时,总希望选择常用的、传递功能强的词;社会财富总是集中在少数人手中,而不多一点则为绝大多数人分享。这实质上是情报离散分布基础上形成的核心趋势和集中取向,是“成功”累积的结果,也是“马太效应”的表现形式。

布拉德福定律的研究虽然取得了突出成果,但也存在两个明显的不足:其一,对情报离散分布的机理研究得还不够深入;其二,对情报离散分布规律的研究还停留在宏观水平上,即对期刊上发表的科学论文分散规律的研究,而在微观层次上对情报离散分布的研究,即在内容单元(而不是文献)和内在逻辑联系层次上的研究仍不多见。尽管埃格希和鲁索出版了《情报计量学引论》,但在论及情报的分散规律时,仍然是以宏观层次的文献为基础的。这说明,情报离散分布在微观层次上的研究难度较大,而微观层次的研究不仅反映情报的真实分布,而且其分布模型将是情报学突破经验层次上升为科学的关键。

情报的这种离散分布或核心趋势(马太效应)是怎样形成的呢?如果仅就布拉德福定律所研究的期刊论文而言,可以这样设想:在某一新的学科中,写第一批论文时,人们首先寄给最合适的期刊,并在其上发表。这些期刊伴随着该学科的发展,刊载越来越多的这类文章,于是著者都希望把他们的文章发表在本专业领域的,过去已经发表了大量高质量论文的这类期刊上。投稿数量大幅度增加,使期刊选择性增大,因而对文章的质量要求提高,期刊的威信也随之日益提高,便产生了一些带“核心”性质的期刊,这就是文献情报分布中的“集中”趋势。与此同时,有关这一学科的文章也在其他相关期刊上发表,便又产生了文献的分散现象。如果我们从具有普遍意义和一般性人类情报行为出发解释这一现象,就会发现这种离散分布所导致的集中趋势是人控制的选择行为在起决定作用。在这种选择作用下,当一系列同类对象被人选择时,就会出现有的经常被选择,有的不常被选择。这种频度不均的选择本身使得对象的特征信息更加突出,又会反过来作为再次被选择的依据。如果我们把对象受到一次选择看成一次成功,那么这种成功的累积必然容易导致新的成功,普顿斯用累积优越性函数来描述这一过程。这便是情报分布中出现马太效应的根本原因。

由上分析可知,布拉德福定律揭示的不仅仅是情报的离散分布,同时又揭示了离散分布基础上的集中取向和核心趋势,它所创造的频次-等级排序方法和对马太效应的深刻解释都具有普遍意义。如布鲁克斯指出:“排序是人类最基本的活动,人们学会讲话和数数之前就懂得按照事物的某一特征进行排序。”(2)排序也必然是人们获取情报信息的重要手段,因而是人类情报过程最基本的特征。频次-等级排序有两个明显的特点:①依照对象的重要程度为序直接表示出分析的数据,提供丰富的信息,有助于认识事物的特征;②频次-等级排序无需任何统计理论或概率假设为基础,就能对事件直接进行分析和解释,应用方便,不受理论约束。这些特征对于分析复杂的人类情报现象和情报过程都是十分有价值的。不仅布拉德福定律,著名的洛特卡定律、齐夫定律等都是通过这种简单的排序而得到的,故又称其为布-齐分布系。通过这种排序揭示的情报对象离散分布的反向趋势-集中取向(马太效应)更使人们看到,相互矛盾、对立的情报现象和情报过程实际上是高度统一的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈