【摘要】:基准标准是指参照标准,对比标准是指进行比对分析的分类表。级别是指比对的最小类别层次。位置系数是指两个字符串比较时,相同字符在字符串的位置对于其语义相似性的影响程度,默认值为0.618。相似度阈值用于筛选生成不同分类与编码体系的类别对照关系,默认值为0.618。图3-6 自动比对结果显示——人工辅助判断
自动转换_情报检索语言的兼容转换
3.5.2 自动转换
自动转换采用基于字面相似度的兼容转换模型和算法,实现任意两种分类表类目之间的自动比对。操作界面如图3-3所示。
图3-3 分类表自动比对界面
具体操作步骤如下:
(1)选择进行比对的两个分类表及其级别。基准标准是指参照标准,对比标准是指进行比对分析的分类表。级别是指比对的最小类别层次。
(2)用户可以自由调整位置系数和相似度阈值。本系统采用的自动比对方法,主要通过计算分类表的类别名称之间的字面相似度来判断来自它们之间的语义相似程度。位置系数是指两个字符串比较时,相同字符在字符串的位置对于其语义相似性的影响程度,默认值为0.618。相似度阈值用于筛选生成不同分类与编码体系的类别对照关系,默认值为0.618。
比对类型:完全匹配和部分匹配。完全匹配是指只筛选相似度值为1的类别对照关系;部分匹配是指只筛选相似度大于阈值的类别对照关系。比对结果显示方式:
●原表对比浏览:左右两边分别显示两种参与比对的分类表,并用紫色字体突出显示具备对照关系的类别。同时,在界面下方显示比对结果的统计数据(参见图3-4)。
图3-4 自动比对结果显示——原表对比浏览
●对照关系表:以关系表的形式显示比对结果(见图3-5)。
图3-5 对照关系表
(3)人工辅助判断:自动比对结果往往存在少量错误,人工可以进行再判断。用户对判断结果可以进行标记(√、╳)、导出、添加、删除和修改等操作。操作界面如图3-6所示。
图3-6 自动比对结果显示——人工辅助判断
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。