首页 理论教育 自动转换数据的方法

自动转换数据的方法

时间:2022-02-27 理论教育 版权反馈
【摘要】:本文以上述四个分类表为例,通过实验结果评价与分析SSC算法的性能。如果两个分类表之间的兼容性较高,人工转换方法和自动转换方法都可以获得较高的匹配率。调查分析发现,关键原因在于该例实验的人工转换结果中存在较多错误。因此,在人工转换结果准确性较低的情况下,相符率指标并不能反映人工转换方法的性能。
实验结果分析_情报检索语言的兼容转换

3.6.3 实验结果分析

目前,国内采用人工方法实现地理信息系统转换的案例比较少。南通市国土局在参照国家标准、行业标准和部分专用分类表的基础上,制定了专用分类表“基础地理数据分类与代码”(简称“南通分类表”),并通过人工方法实现了南通分类表与GB/T 13923—1992、GB 14804—1993和GB/T 15660—1995的转换。本文以上述四个分类表为例,通过实验结果评价与分析SSC算法的性能(见表3-3)。其中,“A”表示人工转换,“B”表示自动转换。

表3-3 分类表转换性能

img65

从类别转换关系数量来看,自动转换方法和人工转换方法基本相当。从匹配率来看,自动转换方法略低于人工转换方法。主要原因在于:一是匹配率与分类表之间的兼容性密切相关。如果两个分类表之间的兼容性较高,人工转换方法和自动转换方法都可以获得较高的匹配率。二是自动转换方法中类别相似度计算主要基于类名之间的字面相似度,存在一定的局限性。部分类别的类名在字面上存在较大差异,但是其表达的语义内容却完全相同。

从正确率来看,自动转换方法的性能比较令人满意,平均高达89.4%。最后,从相符率来看,第一例和第二例实验效果较好。第三例实验的相符率指标仅为34.0%。调查分析发现,关键原因在于该例实验的人工转换结果中存在较多错误。因此,在人工转换结果准确性较低的情况下,相符率指标并不能反映人工转换方法的性能。但是,相符率较低也说明自动转换方法具有一定的优势,它可以建立一些人工转换结果中没有的类别转换关系。

从以上分析可以看出,本文提出的分类表自动转换方法比较有效,既可以与人工转换方法互相补充,也可以在资金、人力和领域专家不足的情况下,替代人工转换方法。但是,基于字面相似度的类别语义相似度计算模型,对于不同的分类表中字面不同而语义相同的类别无法自动建立语义转换关系。在实际应用中,可以先利用本文开发的系统实现绝大多数类别的语义转换,然后对字面不同而语义相同的类别语义关系进行人工辅助判断,可以达到事半功倍的效果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈