的文献增长规律与文献老化指数

时间：2022-05-06 百科知识版权反馈

【摘要】：的文献增长规律与文献老化指数三、普赖斯的文献增长规律与文献老化指数普赖斯,1922年生于伦敦,犹太后裔,物理学博士,美国科学家和情报学家。后来普赖斯还进一步认识到,科学文献的增长并不是无极限地按指数规律增长,在文献增长达到一定极限时,文献便会达到饱和状态,科学文献的增长即由指数增长转为线形增长。所谓“普赖斯指数”,就是在某一统计期内,发表时限不超过5年的文献被引用的数量与引文总数之比。

的文献增长规律与文献老化指数

三、普赖斯(D.Price)的文献增长规律与文献老化指数

普赖斯(Derek de Solla.Price),1922年生于伦敦,犹太后裔,物理学博士,美国科学家和情报学家。尽管普赖斯在天钟、风塔等物理学领域素有研究,但奠定他在科学史上地位的是在文献计量学领域中取得的杰出成就。概括起来讲,他在文献计量学方面的主要成就表现在下列几个方面:

(一)发现科学文献的指数增长规律

1949年,普赖斯在研究新加坡拉费尔斯学院收藏的英国皇家学会创办的《哲学汇刊》时,敏感地发现“一叠叠的《哲学汇刊》靠墙竟堆成了一条完美的指数曲线”^[7]。继而,他对这种世界上创办最早、保存完备的学术期刊进行了统计。他惊喜地发现,在过去的200多年间,科学期刊、科学文献的数量几乎是每50年增长10倍。为了验证他的这一初步结论,普赖斯还对文摘性杂志上的文献进行了统计,结果同样表明,文摘性杂志上的文献也是严格地按照50年增长10倍的规律增长的。因而,他坚信:“似乎没有理由怀疑任何正常的、日益增长的科学领域内的文献是按指数增加的。”^[8]1959年起,普赖斯开始主持科学指数增长规律的系列讲座。1961年普赖斯正式出版《巴比伦以来的科学》(Science Since Babylon)。他在该书中完整地阐发了科学杂志以及科学杂志所刊文献呈指数增长的规律。他满怀信心地写道:“如果依据《世界学术期刊目录》提供的数据,我们已经向值得纪念的10万学术杂志的里程碑迈进。”^[9]他以年代为横坐标,以科学文献量为纵坐标,绘制出文献指数增长曲线,这就是我们通常所说的“普赖斯曲线”。普赖斯还用函数形式描述了科学发展的“指数增长律”,即:F(t)=ae^bt。其中F(t)表示科学的增长指标(科学文献量);a表示环境条件常数,即为统计的初始时刻(t=0)的文献量;b表示时代常数;t表示年份。1963年,普赖斯出版了他的另一本学术名著《小科学大科学》(Little Science Big Science)。在这本书中,普赖斯对文献指数增长规律作了进一步的阐发。^[10]

也许科学研究就是具有承传性,任何一个伟大的发现都不是孤立出现的。早在普赖斯提出文献指数增长规律之前150年(即1798年),英国的人口学家马尔萨斯就提出了人口自然增长的模型,其数学表达式为:N(t)=N₀e^rt。我们无需深入了解马尔萨斯的人口增长模型的数理内涵,仅从这一数学表达式的外形,就可以看出这两者之间有着惊人的相似之处。此外,在普赖斯发现科技期刊、科技文献的指数增长规律之前的100年,恩格斯就在《政治经济学批判大纲》中提出了科学是按累积式规律增长的观点,他认为:“科学发展的速度至少和人口的增长速度一样;人口的增长同前一代人的数量成正比例,而科学的发展则同前一代人遗留下的知识量正成比例。”^[11]当然,这一论断还带有感性认识的成分。普赖斯第一次用科学计量的方法印证了这一论断,并且给出了相对完善的数学表达形式,其在科学计量学史、文献计量学史上的突出地位是不容抹杀的,且影响极为深远。后来普赖斯还进一步认识到,科学文献的增长并不是无极限地按指数规律增长,在文献增长达到一定极限时,文献便会达到饱和状态,科学文献的增长即由指数增长转为线形增长。前苏联科学家弗拉杜茨和纳米莫夫在20世纪60年代就曾用“逻辑斯蒂曲线”(Logistic curve)来修正和重新描述文献的增长过程。

(二)提出衡量科学文献老化程度的计量指标:“普赖斯指数”

科学文献无论是按指数增长,还是先按指数增长再按线形增长,这些均是指文献绝对数量的增长,也就是指文献累积数量的增长。与生命体一样,文献在绝对数量增长的同时,原有文献也有一个逐步老化的过程,这并非指文献物质形态的消亡,而是指文献利用价值的减退。当然,对文献老化的确切含义,学界理解不一,通常就是指文献内容的过时和文献利用价值的衰退。“文献老化”(Obsolescence)这一概念,最早由高斯纳尔(Cosnell)于1943年提出。1958年英国学者J.D.贝尔纳(Bernal)率先借用化学中放射性物质的“半衰期”(Half-life)以及“引文中值年龄”这两个概念,来形象描述文献的老化过程和老化速度。1971年,普赖斯提出了衡量文献老化的量化指标:“普赖斯指数”。

所谓“普赖斯指数”,就是在某一统计期内,发表时限不超过5年的文献被引用的数量与引文总数之比。具体计算公式为:普赖斯指数(P_i)=近五年出版的文献被引用的数量/被引用的文献总量×100%。一般说来,普赖斯指数的值越大,相关文献的老化速度越快,该学科发展也就越迅速。普赖斯在对《科学引文索引》的相关数据进行分析时发现,并不是所有文献的老化速度和老化程度都是相同的,普赖斯指数在22%～39%之间的为“档案性文献”,75%～80%为“有现时作用”的文献。不同学科文献的老化期来临时间也不相同。一般而言,物理学和化学文献的普赖斯指数在60%～70%之间,x射线学的和放射学的指数在55%～60%之间,社会科学文献的指数在40%～45%之间,植物学文献的指数在20%左右,语言学和历史学文献的指数则小于10%。这说明物理学、化学等学科,其发展速度要比历史学、语言学快,这是符合人们的普遍认识的。需要指出的是,普赖斯本人认为“普赖斯指数”这样一个衡量文献老化程度的指标,不仅可以用来对学科发展进行评价,还可用来对期刊、科研机构、学者进行评价。^[12]

普赖斯还发现,一般科学文献在发表后的第二年,被引用的频次达到高峰(Research front)。^[13]有些价值不大或者不适合引用的文献被引用的时限小于两年,而一些学术价值较大的“档案性文献”被引用高峰期的来临则要高于两年。普赖斯的这一“研究峰值”(Research front)思想在此后的引文分析中有较为广泛的运用,尤其是在“核心期刊”遴选中引文数据采集的时效性上,有着重要的指导价值。

总之,“核心期刊”的概念,最初属文献计量学(Bibliome-trices)的范畴。上述三大理论既是文献计量学的重要原理,也是“核心期刊”遴选的理论基础。普赖斯所揭示的科学文献、科学期刊的指数增长规律,是“核心期刊”研究和遴选成为必要的现实前提。文献的迅速增长,客观上需要人们对文献的产出、收集和利用等问题进行深入研究,需要对专题文献分布较为密集、文献质量相对较高的“核心期刊”进行遴选,需要对现有文献进行科学评估,需要为治学者提供“门径”,这样才能充分利用现有资源,有力推进科学发展和社会进步。布拉德福的文献离散定律则首先揭示出文献在期刊中的分布规律,为人们从文献数量的角度来寻求特定主题的“核心期刊”提供了理论支持。而加菲尔德所创造的引文索引系统和引文分析理论体系则又为人们从文献质量的角度遴选“核心期刊”,提供了一个重要的量化测度指标。脱胎于布氏定律和加菲尔德分析体系的“载文量”与“被引率”,无论是国外还是国内,都一直是“核心期刊”遴选的两个最基本、最重要的量化测度指标。尽管国外“核心期刊”的相关理论甚为繁复,但如果我们去粗取精、削繁就简,就可以看出上述三大理论,即“文献离散定律”、“引文分析体系”、“普赖斯指数和研究峰值理论”,共同构成了一个相对完备的“核心期刊”理论体系,影响相当深远。

【注释】

[1]“布氏定律”最为原始的表述见于布氏1936年发表的“Sources of Information on Specific Subject”一文。现将原文中的相关文字援引如下:If scientific journals are arranged in order of decreasing productivity of articles on a given subject,they may be divided into a nucleus of periodicals more particularly devoted to the subject and several groups or zones containing the same number of articles as the nucleus,when the numbers of periodicals in the nucleus and succeeding zones will be as 1:n:n²……。
此文发表迄今已有70年历史,英语本身有发展,中西文化也存有差异,国内学界对此段文字的理解和译法,不尽相同。较有代表性的是《中文核心期刊要目总览》(第3版)中的译法:“对某一特定主题而言,将科学期刊按其登载相关论文减少的顺序排列时,都可以划分出对该主题最有贡献的核心区,以及含有论文数量与之相等的几个区。这时核心区与相继各区的期刊数量成1:a:a²……的关系。”(a大于1,约等于5)。
不过,这种译法,值得商榷。是不是“都可以划分出”核心区和相继各区?布氏“Sources of Information on Specific Subject”原文中使用的是“they may be divided into……”(它们就可能被分成……),而不是“they will be divided into……”,更不是“they must be divided into……”。将“they may be divided into……”译成“都可以划分出……”,是把问题绝对化了。结合国内“核心期刊”的遴选情况来看,也不是所有学科的论文在期刊上的分布都符合这一规律,有些学科(或专题)的论文在期刊上的分布就没有形成“核心区”。此外,原文中是1:n:n²……,《中文核心期刊要目总览》中使用的却是“1:a²:a²……”,不知何故,抑或采用的是后续版本?
笔者文中的译法,似更切近布氏原意,也更切合论文在期刊上的实际分布状况。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈