由著者同被引可视化构造的知识图谱

时间：2023-02-27 理论教育版权反馈

【摘要】：图3-7　情报科学前100位作者的同被引分析图1999年Chen Chaomei把寻径网络技术引入作者同被引分析，并生成了有关超文本研究的同被引图［16］。这两者的不同体现在可视化图上，影响力大的文献作者在用前者生成的图中位于每个分支的中心节点位置，而在用后者生成的图中其中心位置不明显。

由著者同被引可视化构造的知识图谱_基于引文分析可视化的知识图谱构建研究

3．3．2　由著者同被引可视化构造的知识图谱

Irina Marshakova通过对文献同被引数据进行分析，于1981年发文提出情报科学的各研究分支可以用聚合成簇的作者来表示^［14］，这对后来的作者同被引分析的发展有很大的启发作用。几乎在同时，美国费城德瑞珂赛大学（Drexel University）的Howard D．White在1981年发表文章，把同被引的分析对象由文献扩展到了著者。Howard D．White等认为，在某一个学科领域内，把论文作者按照其研究范围的远近进行分组也可以从中考察该学科领域研究的面貌，能满足研究者对该领域内各研究团体进行了解的需求^［10］。

Howard D．White和K．W．McCain在1998年以SPSS为工具，采用聚类分析、多维尺度分析和因子分析，通过对1972—1995年间世界情报学文献作者的同被引分析，以图示的方式描述了情报科学的结构。如图3-7所示，情报科学大致被分为两大阵营，即文献计量（包括引文分析）和情报检索。在数量上，检索学家占据优势，图中没有出现对学科发展起导向作用的核心作者或核心作者集团^［15］。

图3-7　情报科学前100位作者的同被引分析图（1972—1979）

1999年Chen Chaomei把寻径网络技术引入作者同被引分析，并生成了有关超文本研究的同被引图^［16］。寻径网络分析方式的引入为作者同被引分析的可视化揭开了新纪元。该方式采用原始同被引频次，将作者视为节点，节点间的路径代表作者与作者之间的同被引强度，当许多作者与某个核心作者同被引强度很高时，专业分支自动形成，无需单独的聚类程序。它与传统的作者同被引分析技术最大的不同在于：在计算作者相似性时直接采用同被引频次，而后者则把同被引频次经过转换计算皮尔逊相关系数度量作者相关性。这两者的不同体现在可视化图上，影响力大的文献作者在用前者（直接采用原始同被引频次）生成的图中位于每个分支的中心节点位置，而在用后者（采用皮尔逊相关系数）生成的图中其中心位置不明显。因此2003年Howard D．White采用PFNET对1998年的同一数据进行了分析，并对分析结果进行了图示（图3-8），得出了与1998年不太相同的结论，即：在情报学领域中有4位领袖人物，分别是G．Salton，E．Garfield，F．W．Lancaster和D．Price，Lancaster，是连接以Salton为领军人物的检索学家集团和以Garfield为领袖人物的文献计量集团的纽带^［17］。这次的分析结果无疑更加符合情报科学的认知结构，显然优于1998年的分析结果。

Chen Chaomei和同事继1999年发表了关于应用寻径网络技术对作者同被引进行可视化分析后，又陆续发表多篇文章介绍利用该技术进行作者同被引分析生成学科知识图，对知识领域进行可视化显示（knowledge domain visualization），揭示某一领域的理论的动态沿革，鉴别其中的发展动向和转折点，预测发展趋势，发现正在形成的新的专业学科。他用该方式生成的可视化图是一种三维空间彩色图，以小球代表文献节点，以小球之间的连线长短代表同被引强度，以垂直于小球的立柱高度代表文献的被引频率，用不同的色彩、动画展示其中的突出点^{［18，19，20，21］}。例如在2003年发表的文章中，他和J．Kuljis探索利用该方法进行同被引分析是否能够反映出物理学超粒子（super string）研究过程中1984年和1995年分别发生的两次理论革命。结果发现，从可视化图中可以鉴别出Green和Schwarz以及Witten在1984年发表的代表第一次革命的文献和Polchinski在1995年发表的代表第二次革命的文献。每次理论革命都以标志性文献为起点，带动了大量相关引用文献簇的出现，形成了同被引文献核心簇^［22］。

图3-8　121位情报学论文作者寻径网络可视化图

著者同被引是与文献同被引紧密相联的，只不过著者同被引是以著者本身为基础的。假定两个作者的作品同时被后继的作品引用表明这两个作者之间有联系，共同被引用的次数越多，它们之间关系就越紧密。一组相关作者的同被引频次模式分析能揭示出作者间突出的链接，并能揭示它们各自或共同代表的主题领域。从著者同被引分析出现开始，就一直被以映射图的方式来探究科学和学术内部的专业知识结构、揭示文献的影响力、探讨学科范式、提供可视化的信息检索界面等。

需要注意的是关于著者之间的同被引强度，国内的文献计量学方面的著作很多都把两个著者的同被引强度解释为同时引用这两个作者所著文献的著者的数量，这是不符合实际的。根据Mc－Cain 1990年所做的关于著者同被引分析技术的综述^［23］，通过SCI获取两个著者的同被引频次时，解释为同时引用这两个著者的著作的论文的数量。因此，著者同被引频次（强度）应该以论文数量来计量，而不应该以著者数量来计量。同样的，期刊同被引强度、类目同被引强度都应该以同时引用它们的论文的数量来计量。实际上，JCR对某一类目被其他类目引用的频次也是以论文数量来计量的。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈