首页 百科知识 数据的简缩

数据的简缩

时间:2022-02-27 百科知识 版权反馈
【摘要】:5.3 数据的简缩数据简缩是指把同被引矩阵中的某些行和列去掉,使之缩减。例如,同被引矩阵中只与一两个分析对象发生关系的对象,对研究分析对象之间错综复杂的相互关系及其所代表的学科结构意义不大,可以舍去。K的取值由所研究的学科专业的性质决定,引文越分散,则K取值越低,原则是使简缩后的同被引矩阵的大小足以反映所研究学科的情况。
数据的简缩_基于引文分析可视化的知识图谱构建研究

5.3 数据的简缩

数据简缩是指把同被引矩阵中的某些行和列去掉,使之缩减。同被引分析的目的要求是明确的,那些对实现这一目的意义不大的数据即可舍去。例如,同被引矩阵中只与一两个分析对象发生关系的对象,对研究分析对象之间错综复杂的相互关系及其所代表的学科结构意义不大,可以舍去。同被引数据简缩的方法,一般是将同被引矩阵中非零项少于K的行和列去掉,即去掉只与不足K个分析对象发生同被引关系者。K的取值由所研究的学科专业的性质决定,引文越分散,则K取值越低,原则是使简缩后的同被引矩阵的大小足以反映所研究学科的情况。一般使K/N(N为初选分析对象个数,同被引矩阵的维数)在2.5%~20%之间[18]。考虑到国内中文学术期刊的篇均参考文献数普遍不高,这里取较低的比例,在本研究中只删除那些非零数值项少于3的行和列。

在“矩阵A”中,经过缩减后,剩下了59位著者。

在“矩阵B”中,经过缩减后,矩阵中最后只剩下了50位著者。

在“矩阵C”中,由于大多数行列的非零项很少,如果还按照上述缩减原则删除非零项少于3的行与列将会造成剩下的过少,因此,只删除了那些非零数值项不大于1的行和列,经过缩减后,矩阵中最后只剩下了47位著者。

在“矩阵D”中,经过删除非零项不大于3的行和列后,剩下了38位著者。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈