首页 百科知识 双重分类原理

双重分类原理

时间:2022-02-27 百科知识 版权反馈
【摘要】:9.2 双重分类原理以上讨论了各种有关分类器的相关原理知识。因本书拟采用其中的粗糙集用于辅助自动分类,所以花了较大的篇幅作了介绍。在前期的分类过程中,本系统单纯采用向量距离分类法,并保留了最为匹配的自动分类结果的前三个最佳选择。通过与人工分类结果的对比分析发现,很多时候,自动分类的第一个结果并不是最佳选择,反而排在第二或第三位的自动分类结果与人工分类结果相符。
双重分类原理_文本自动标引与自动分类研究

9.2 双重分类原理

以上讨论了各种有关分类器的相关原理知识。因本书拟采用其中的粗糙集用于辅助自动分类,所以花了较大的篇幅作了介绍。当前在中文信息处理领域,现在人们已经开始汲取“经验主义”与“理性主义”两种方法之长,以实用的智能化系统为目标。无论在语音识别、汉字识别、自动分词、词性标注、自动文摘等,还是机器翻译领域,都已经有人在采用统计方法与规则相结合的手段。

基于以上考虑,同时我们也发现,粗糙集分类的前期特征项抽取计算过程与基于统计的各分类方法有一定的相似性,故本书拟采用粗糙集与向量距离分类法相融合的办法来完成自动分类。

在前期的分类过程中,本系统单纯采用向量距离分类法,并保留了最为匹配的自动分类结果的前三个最佳选择。通过与人工分类结果的对比分析发现,很多时候,自动分类的第一个结果并不是最佳选择,反而排在第二或第三位的自动分类结果与人工分类结果相符。如表9-3所示。

由表9-3中打阴影部分的分类结果可知,当采用前两个首选结果进行正确率统计时,正确率都有较明显提高。可以设想,如果加入第三个首选项进行综合统计,结果将会有进一步的提高。这种情况,一方面说明某些类可能同时与两个类有关联(即分属多类现象),另一方面也可由此推断,如果存在这样一种方法,它能从统计分类的前三个推荐类中进一步判断筛选出其中正确的分类结果,这将会对自动分类的效果有较大的提升。

表9-3 向量距离分类结果示意(片段)

img131

基于以上分析,本书考虑进行统计与规则结合的双重分类方法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈