首页 理论教育 图谱技术的基础是什么?Vosviewer介绍

图谱技术的基础是什么?Vosviewer介绍

时间:2022-09-19 理论教育 版权反馈
【摘要】:本研究绘制奖项图谱采用的是由荷兰莱顿大学科学与技术研究中心开发的VOSviewer。[11]VOS图谱技术的基础是相似性矩阵。因此,VOSviewer绘制的图谱是基于待比较项目之间的距离计算生成的。VOSviewer采用的优化算法是重复优化算法的变体。显然,能够根据相同的共现矩阵生成始终如一的图谱,对于VOSviewer非常重要。为了实现这个目标,VOSviewer通过以下三个方式将通过优化计算得到的解进行了转换:①平移。通过以上三种转换就可以保证VOSviewer生成一致的结果。

本研究绘制奖项图谱采用的是由荷兰莱顿大学科学与技术研究中心(Centre for Science and Technology Studies at Leiden University)开发的VOSviewer。VOSviewer是基于共被引用数据(co-citation data)来建立关于作者或期刊的图谱,或者基于共现数据(co-occurrence data)来建立关于关键词的图谱。VOSviewer采用的是VOS图谱技术(VOS mapping technique), VOS的含义是“相似性可视化”(visualization of similarities,VOS)。[9]本研究采用VOSviewer的原因一是由于该软件可直接对共现矩阵自动进行相似性计算;二是由于VOSviewer采用的相似性计算方法是关联强度,这种方法这种能够适当地修正规模效应,即在其他条件相同的情况下发生次数多的个体与其他个体间会有更多的共现的现象,[10]而且还能对高频出现的项目和低频出现的项目进行更为公平的比较。[11]

VOS图谱技术的基础是相似性矩阵。设有狀个需要通过绘制图谱来反映它们之间相似性或关系远近的目标,即狀个项目(item),分别标记为1,…n。这样,这些项目之间相似度(用狊来表示)就构成了一个n阶的相似性矩阵S,S=(sij),i,j∈{1,…n}。其中,sij满足以下特征:sij≥0,即两者间的相似度不为负值;sijj=0,即同一项目的相似度为0;sij=sij,即项目s与项目j之间的相似度等于项目j与项目i之间的相似度。VOSviewer采用的相似性测量方法——关联强度的计算方法如公式1所示,sij代表项目i与项目j之间的关联强度大小,cij为项目i和j共现(co-occurrences)的总次数,wi和wj分别是指项目i和j各自出现或共现的总次数。一般为了数据呈现的方便,还会将相似性计算结果再乘以N,即全部参与比较项目的共现的总频次。[12]VOS绘制图谱的目标是,在低维度空间里(一般是二维空间)每对项目间的距离尽可能准确地反映它们的相似度。因此,VOSviewer绘制的图谱是基于待比较项目之间的距离计算生成的。相似度高的项目,在图谱中的位置就靠近;反之,相似度低的项目在图谱中的位置就离得远。[13]

VOS图谱技术的绘图理念是最小化所有项目对的欧几里得距离(Euclidean distance)平方的加权和。项目间的相似度越高,它们的平方距离在求和计算中的权重越大。为了避免所有项目在图谱中的位置即坐标一致, VOS图谱技术还对所有项目进行了约束:所有项目间的平均距离必须等于1。仍以上述狀阶矩阵为例,VOS图谱技术期望最小化的目标函数如公式2所示,其中向量xi=(xi1,xi2)代表一个在二维知识图谱中项目i的位置,‖·‖代表的是欧几里得范数(Euclidean norm)。目标函数所服从的约束条件如公式3所示。其实,在自变量满足约束条件的情况下,将目标函数最小化的问题是一个约束优化问题(constrained optimization)。这个约束优化的过程分两个步骤,先是把约束优化问题转化为非约束性问题,之后再用一种优化算法(majorization algorithm)来解决。VOSviewer采用的优化算法是重复优化算法(SMACOF)的变体。为了增加找到全局最优解(globally optimal solution)的机会,优化算法会被程序运行很多次,每一次都使用一种不同的计算产生的初始解(initial solution)。[14]

全局最优解(最后的图谱)并不是唯一的。这是因为如果一个解是最优的,那么这个解的任何平移(translation)、旋转(rotation)或映射(reflection)也必须是最优的。显然,能够根据相同的共现矩阵(co-occurrence matrix)生成始终如一的图谱(除了由局部最优导致的差异外),对于VOSviewer非常重要。为了实现这个目标,VOSviewer通过以下三个方式将通过优化计算得到的解进行了转换:①平移。通过平移使图谱的中心处于原点上。②旋转。通过旋转使得横向维度上的方差达到最大化。这种转换其实就是主成分分析(principal component analysis)。③映射。假设i与j分别代表横向维度的最低和最高坐标,犽与犾分别代表纵向维度的最低和最高坐标,那么如果i>j,那么图谱就围着纵轴来映射。如果犽>犾,那么图谱就围着横轴来映射。通过以上三种转换就可以保证VOSviewer生成一致的结果。[15]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈