首页 百科知识 遴选结果的整合尝试

遴选结果的整合尝试

时间:2022-05-06 百科知识 版权反馈
【摘要】:遴选结果的整合尝试四、遴选结果的整合尝试笔者2002年曾以个人之力对各“核心期刊”遴选体系的遴选结果进行过整合,因当时资料所限,未能提出上述整合构想。不过,当时整合遴选结果的目的也是要促进期刊遴选体系之间的深层次、实质性整合。这一基本遴选思路可图示如下:图7 遴选结果整合示意图图中A表示“北图体系”中的“核心期刊”;B表示“社科院体系”中的“核心期刊”;C表示“南大体系”中的“来源期刊”。

遴选结果的整合尝试

四、遴选结果的整合尝试

笔者2002年曾以个人之力对各“核心期刊”遴选体系的遴选结果进行过整合,因当时资料所限,未能提出上述整合构想。现在看来,这种做法乃不得已而为之的下策之举。不过,当时整合遴选结果的目的也是要促进期刊遴选体系之间的深层次、实质性整合。为了不至于造成误解,这里删除当时的整合结果,而将当时整合的大致思路姑录于后,以便读者了解本书作者对“核心期刊”相关问题的认识进阶。

一、研究源起

就我国的社科期刊而言,目前有三大遴选体系影响较著。一是“北图体系”,即北京大学图书馆主持研究的“核心期刊的文献计量学研究”遴选体系,以《中文核心期刊要目总览》(一、二、三版)为标志性成果;二是“南大体系”,即南京大学的《中文社会科学引文索引》(CSSCI)遴选体系,该体系已公布1998、1999、2000年的“来源期刊”;三是“社科院体系”,即中国社会科学院文献信息中心的“社会科学文献计量”遴选体系,以《中国人文社会科学核心期刊要览》(2000年版)为标志性成果。这三个体系研究力量雄厚,资金投入较大,且各有所长。但是,期刊遴选是一个十分复杂的系统工程,任何单一的理论框架要做到完全客观、公正,几乎是不可能的。也许,最简单的方法最科学,本文即以上述三大体系为基础,对三个体系的遴选结果进行整合,最终目的只有一个,就是兴利除弊,促进期刊遴选体系之间的深层次、实质性整合。

二、基本思路

遵循求同存异的原则,以目前影响最著的上述三大体系的入选期刊(“核心期刊”、“来源期刊”)为备选期刊,运用比照、合并、去重、再选等方法,整合三大代表性体系遴选结果,从而再度遴选出“中国哲学、社会科学核心期刊”。考虑到期刊遴选的时效性,以新近出版或公布的北京大学图书馆《中文核心期刊要目总览》(2000年版,即第三版)[3]、南京大学中国社会科学研究评价中心《中文社会科学引文索引》(CSSCI)2000年“来源期刊”[4]、中国社会科学院文献信息中心《中国人文社会科学核心期刊要览》(2000年版)[5]为遴选底本。对某一期刊而言,只要同时为两大以上体系(含两大体系)中的入选期刊,那么这一期刊即为重新遴选出的“核心期刊”。某一期刊如果只是一种体系中的“核心期刊”(或“来源期刊”),即便所占分值再高,也不能入选。然后,运用数理方法,依“北图体系”、“南大体系”,对入选的“核心期刊”重新进行排序。这一基本遴选思路可图示如下:

img15

图7 遴选结果整合示意图

图中A表示“北图体系”中的“核心期刊”;B表示“社科院体系”中的“核心期刊”;C表示“南大体系”中的“来源期刊”。图中的阴影部分即为再度入选的“核心期刊”。

三、具体步骤

整合、重选过程依下列五大步骤进行:

(一)以国家标准为依据,将三大体系中对应的入选期刊合并、去重,作为“备选期刊”。

(二)用数理方法(详见下文)计算每种备选期刊在各大体系中的得分;继而求得每种备选期刊在三大体系中的总得分。

(三)依总得分,降序排列备选期刊。

(四)截取“核心期刊”,即剔除只入选某一体系的期刊,保留同时入选两大体系和三大体系的期刊。

(五)重新依入选期刊的总得分降序排列各刊,最终确定入选期刊的排列序号。

四、学科分类

“北图体系”的学科分类以《中国图书馆分类法》(第四版)[6]为参照;“社科院体系”以《中国图书馆图书分类法》(第二版)为基础;南大体系虽未标明分类依据,但可看出是以国标《学科分类与代码》为依据的,只不过又根据具体情况作了适当的调整。尽管《中国图书馆图书分类法》从第四版起,已更名为《中国图书馆分类法》,用途似乎有所扩大。但笔者以为,这一分类还只能主要适用于图书馆,适用于图书馆对图书的分类和管理,“北图体系”,将学术性期刊、非学术期刊均纳入备选期刊,这便是从馆藏角度考虑的明证。实际上,期刊分类与图书分类并不是一回事。另外,“核心期刊”的一个最为显著的特点就是学科性,遴选的对象应为学术期刊,而并不是所有的期刊。因此,本文将严格按照中国国家标准《学科分类与代码》(GB13745-92)[7]来整合这三大体系。三大体系中“南大体系”、“社科院体系”入选的皆为学术期刊,“北图体系”有不少的非学术期刊,这些非学术期刊在再选时将自然被淘汰。

这里有几点需要特别说明。其一,中国国家标准《学科分类与代码》是国家技术监督局1992年11月批准、1993年7月起实施的,距今已有八、九年之久,但未见有新的国标面世。鉴于这一国标体系已纳入了一些“成长中的新兴学科”,也由于一门新兴学科从萌芽到成熟并不是一朝一夕的,而且,新兴学科的形成又往往最先出现在分支学科(如二级、三级学科)之间。因此,就时效性而言,这一国标对本文“核心期刊”再选的影响不大。其二,国标中指出,“环境科学技术”、“安全科学技术”、“管理学”三个一级学科属于综合学科,在国标中列于自然科学与社会科学之间。鉴于“南大体系”中,另列“人文、经济地理”(在国标中列入自然科学一级学科“170地球科学”中的二级学科“170·45地理学”中),而在其他两大体系中也有相类似的期刊,因此,再选的“核心期刊”表亦列有“170·45地理学”。与此类情况相似,也列出“环境科学”核心期刊。其三,在“北图体系”中列有“综合性人文、社会科学核心期刊表”,在“南大体系”中列有“社科总论”(大多为各级社科院、社科联系统主办的综合性人文社会科学学术期刊)、“高校综合性社科学报”两类来源期刊。“社科院体系”中也同样列有“社会科学总论”、“社会科学学报”两类核心期刊。笔者认为,“社科总论”期刊、“高校社科学报”,就期刊性质而言,均为综合性社会科学学术期刊,在“核心期刊”遴选时,不应当按期刊的行政隶属关系来进行分类。因此,重新选出的“核心期刊表”,只根据期刊的学科性列出“综合性社会科学核心期刊”一类,不作行政区分,并据此来整合这三大体系中的相关期刊。

五、数据处理

在“北图”和“南大”两大体系中,入选期刊的排列有先后次序之分。为了遵循求同存异的总体原则,再选的“核心期刊”表也应考虑入选期刊的排列顺序问题。为此,笔者设定国标中所设的每一个相关的一级学科,它所对应的三大体系中的所有相关期刊的总分值为1。在这样一个前提下,来计算三大体系中各刊的得分,最终以各刊总分值(某刊在三大体系中的得分之和)为顺序,从大到小排列入选期刊。

(一)“北图体系”、“南大体系”中某个入选期刊的得分可分下列两种情况求得。

当国标中的某个一级学科与某个体系中所设的学科吻合时,通过下列公式求得该体系中入选期刊各自的得分:(n指某一体系某一学科中的核心期刊总数)

img16

公式中的z为“北图体系”或“南大体系”中某一学科“核心期刊”总数;n为“北图体系”或“南大体系”中某个“核心期刊”或“来源期刊”的排列序号数;z-n+1实为第n种期刊的倒数序号数,Vn即为某刊(n)在某一体系中的得分。例如:

“北图体系”设有“A马克思主义、毛泽东思想、邓小平理论类核心期刊”,“南大体系”设有“马克思主义”来源期刊,两个体系中的名称虽略有不同,但本质一致。这与国标中的一级学科“710马克思主义”相吻合,因此,我们就可通过上述公式来求得对应的备选期刊在该体系中的得分。如,《马克思主义研究》在“北图体系”中是“A马克思主义、毛泽东思想、邓小平理论类”的核心期刊,它所在类的“核心期刊”总数z=6,它的排列序号数n=2,其在该体系中的得分V2就可由上述公式求得。

当国标中所设的某个一级学科,在“北图体系”、“南大体系”中对应着几类“核心期刊”时,我们可用下列公式求得各刊的得分:

img17

公式中R为对应的类目数。如国标中的一级学科“720哲学”,在“南大体系”中对应的有两类来源期刊:“哲学类”10种、“心理学类”7种。为了确保每个学科的总分值均为1(这样才有可比性),在计算“南大体系”中“哲学”和“心理学”来源期刊得分时,将初步求得的分数再除以对应的类目数R(此时R=2),从而求得该刊在该体系中的最终得分,这样就保证了某个体系中整个“哲学”学科入选期刊的总分值仍为1。需要指出的是,这种情况在北图体系、社科院体系中是非常普遍的,也是数据处理过程中最为繁复的一个部分,尤其是在类目数较多、入选期刊较多的时候。

(二)在社科院体系中,各刊的排列是按音序排列的,而不是按照分值的大小排列的。因此,在计算该体系中各刊的得分时,不考虑原有次序,各刊由下列公式求得平均分:

Vn=1/Z

Z为国标中某个一级学科在“社科院体系”中对应的所有入选期刊的总数。例如国标中的“哲学”学科在“社科院体系”中对应为三类核心期刊表:B0哲学理论(6种);B2中国哲学(5种);B84心理学(5种)。那么此时公式中的Z=15,该体系中的任一入选期刊n在该体系中的得分Vn,就可由上述公式求得。

根据上述构想,本文再选出“核心期刊”416种(已删除具体结果)。这里仅以学科“710马克思主义”为例,略作介绍:

表5 “710马克思主义”原始数据表

img18

此类在“北图体系”中为6种;“南大体系”中为11种;“社科院体系”中为5种。各自的名称略有不同,现依国标统一调整为“710马克思主义”。这样再选出的“马克思主义学科核心期刊”依次为:1.毛泽东思想研究;2.马克思主义研究;3.马克思主义与现实;4.毛泽东邓小平理论研究;5.教学与研究。

值得一提的是,核心区的截取一直是核心期刊遴选的一个棘手问题,各个体系对其理解不一。就某些学科而言,三大代表性体系入选期刊的数量也相距甚大。研究中,曾先以三大体系相关学科入选期刊的平均数来截取核心期刊,其结果与用文中的方法截得的核心期刊的数量甚为接近,是不是可以认为,文中所列的各学科核心期刊数量是一个相对公允的数量。另,本文重新遴选出的核心期刊的数量与“南大体系”2000年“来源期刊”的数量,亦相差无几。亦似可认为,“南大体系”所选2000年“来源期刊”419种与本文所列各学科核心期刊的总量416种是截取目前国内哲学社会科学核心期刊的一个比较合理的数量。

【注释】

[1]这里顺便说一下“大样本”与“小样本”统计的问题。“小样本”统计主要依据是“二八定律”,就是用较少的“费用”可以获得较好的“效果”。这是有道理的,但不是说就没有缺陷。国内的几家“引文索引”采用的都是“小样本”统计,但统计的结果往往一篇文章被引只有几次、十几次、几十次,如此之少的引文数据,很难保证引文分析、评价的准确性。“小样本”统计一直强调选刊要严格,但“有所闪失”不可避免,用从这些来源刊上获取的引文数据来进行评价,结果有时反而会适得其反,正所谓“失之毫厘,谬以千里”。因此,如果条件允许,在不增加“费用”的情况下,用“大样本”进行统计应该比“小样本”统计更具说服力。而现在的技术条件是完全可以做到这一点的,现在计算机可以实现海量存贮了。清华大学编制的《中国学术期刊综合引证报告(2004年版)》就是依据5716种期刊的“大样本”统计,其优越性不言自明,值得目前国内“引文索引”借鉴。
值得一提的是,“SCI”的创始人尤金·加菲尔德曾对引文索引的收录范围有过详细论述,有助于我们理解“大样本”与“小样本”统计的利弊,现引如下:“理想上,科技期刊文献的综合性引文索引最好能够收录所有已经出版的科技期刊。然而,由于种种原因,这种想法是不切实际的,甚至是不可能的。其中一个原因是没有人能够知道到底总共出版有多少种期刊,因为对构成期刊的条件众说纷纭,莫衷一是。有些连续出版物每年仅出一期,这种频率使人对它们是否算是期刊实在表示怀疑。许多所谓的科技期刊出版频次虽高,但是其中能够真正帮助解决的资料却很少。还有很多的期刊不能够长久维持,不能引起人们对它们的注意。收录所有期刊的想法之所以不现实的另一个原因是经济问题。去掉具有上述缺陷的连续出版物之后,大概还有10000种左右的出版物,其出版意图、出版频率和持久性均使它们有资格被称为科技期刊。如果这些期刊中的每一种每年平均发表100篇论文,综合性的引文索引所要收录的文献总量就是一年100万篇来源文献。再者,SCI中收录的一般论文,都需要经过对长达大约1000个字符的计算机记录的建立、输入、存储和处理过程,仅数据输入和计算机处理费用,就足以使人们相信:在目前现实情况下不大可能做到完全记录。因为,经济问题迫使综合性的引文索引也必须是有选择的……”。[8](P14)从上述引文可以看出,加氏当年是倾向于有选择性地收录期刊的,这主要是由经济、技术问题造成的,但他也认为理想的做法是全部收录。就我国而言,大多数学术期刊都已加入“中国学术期刊全文数据库”,论文排版规范已实施多年,相关的国家标准也即将出台,对引文的收集,已不再需要太多的人工录入,在这种情况下,实现“大样本”统计不仅必要,而且可能。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈