著者同被引频次的获得方法及其各自的特点

时间：2022-02-27 百科知识版权反馈

【摘要】：5．2．2　著者同被引频次的获得方法及其各自的特点从引文库中在线检索获得同被引频次。SCI对文献作者的被引只反映第一著者的被引情况，而在实际情况中，合著现象非常普遍，且有增多的趋势，因此，只计算第一著者和不管是否为第一著者，计算得到的著者之间的同被引数量存在一定的差异。

著者同被引频次的获得方法及其各自的特点_基于引文分析可视化的知识图谱构建研究

5．2．2　著者同被引频次的获得方法及其各自的特点

（1）从引文库中在线检索获得同被引频次。

对于从SCI或SSCI等获取引文数据的用户，在20世纪80年代中期以前，可以通过DIALOG检索系统利用一定的检索策略直接获得任意两个作者的同被引频次，而且一次可以同时输入45个著者，通过一个叫INTERSECT的程序获得它们之间的同被引频次，这样很容易能够获得著者之间的同被引次数^［1，2］。但是，从80年代中期后，DIALOG不再提供这种检索功能，因此，从80年代中期到2000年这将近15年的时间内，用户如果要想在线直接获得著者之间的同被引次数，需要采取以下的检索策略，即检索参考文献中含有两个著者的名字的文献条目。例如，要检索著者MERTON R和MULLINS N两人之间的同被引次数，用表达式表示即：

SELECT CR＝MERTON R AND CR＝MULLINS N

这样一次次检索，如果要构建一个有50个著者的同被引矩阵，则需要这样检索50×50÷2＝1 250次。利用该方法的优点是能够全面获得著者之间的同被引次数，但是该方法比较繁琐枯燥，如果著者数目更多，其工作量无疑更大。

（2）运用程序对下载的引用这些作者的文献集合进行计算。

为了解决在线检索同被引频次比较繁琐的问题，一些学者也想出了一些办法，例如Penan H曾开发了一系列的小程序收集同被引次数；Paisley的办法是搜集引用每个作者的所有文献的ID号，通过另外编程计算作者之间的同被引频次^［3］。

（3）根据收集到的文献及引文计算。

前面两种办法的前提是必须知道确定的作者，有目的地去搜集他们两两配对的同被引频次，过程仍然比较繁琐。同时，从2000年开始，SCI的网上在线检索已经不能再通过组合检索直接获得著者的同被引频次，即不再提供通过CR字段进行检索。因此最近几年来，为了简便，一些学者对于某一专题学科研究的著者的同被引分析，在不知道要计算哪些著者之间的同被引次数的情形下，往往先根据一定的主题词在SCI中检索有关这一学科的所有文献目录，并套录这些文献目录和它们引用的所有的参考文献目录，通过一定的计算机程序读取这些下载的数据，再导入自己的数据库中，相当于构建了一个小型的专业学科性的引文数据库，再根据这个引文数据库构造著者同被引矩阵。这里需要注意的是，由于统计的原因，文献被引用次数的高低和引文统计范围有一定的关系，因此，利用该方法的情况下，由于检索到的来源数据范围的限制，很多著者在这一特定的文献集合（被检索下载的这些文献）范围内的被引用次数远远低于其原来在整个引文数据库中的总的被引用频次，而一个著者总被引频次降低，将导致最后的同被引矩阵中各著者之间的同被引次数较低。特别是对一些开放性的和交叉性的学科，有影响力的文献和著者可能被外学科广为引用，这样如果限定在本学科范围内的文献集合，考察时某些著者之间的同被引强度有可能不高，但在较大的范围内考察时这些著者之间却具有较高的同被引强度。这可以通过第四章LCS和GCS的差别就可以看出（见图4-1）。

SCI对文献作者的被引只反映第一著者的被引情况，而在实际情况中，合著现象非常普遍，且有增多的趋势，因此，只计算第一著者和不管是否为第一著者，计算得到的著者之间的同被引数量存在一定的差异。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈