首页 理论教育 计算机实现分类号与对应主题词标引的必要性

计算机实现分类号与对应主题词标引的必要性

时间:2022-02-27 理论教育 版权反馈
【摘要】:6.2.1 研究综述1997年,戴晶萍在侯汉清教授指导下,在其学位论文中指出计算机实现分类号与对应主题词标引的必要性[3]。Log L的筛选标准为:将样本库中标引词小于3的记录删除。2001年,薛鹏军在进行网页的自动分类研究时,继续采用MI 和Log L方法,结果论证了后者优于前者。实验结果表明,利用MI方法,分类号与标引词的对应正确率可达57.4%,利用Log L方法正确率达74.5%[6]。
研究综述_文本自动标引与自动分类研究

6.2.1 研究综述

1997年,戴晶萍在侯汉清教授指导下,在其学位论文中指出计算机实现分类号与对应主题词标引的必要性[3]

1998年,Goetz具体说明了Log L方法,并将其用于对《美国国会图书馆标题表》(LCSH)标题词与《杜威十进分类法》(DDC)分类号的自动匹配,并进行了实验研究,说明利用Log L方法可以过滤LCSH与DDC对照数据库中的错误记录[4]

1999年,张雪英在研究经济分类表-叙词表转换系统时,采用MI和Log L方法对标引词-分类号进行统计分析,得出某一标引词或词串所对应的最相关的分类号,试验结果论证了Log L方法优于MI方法。Log L的筛选标准为:将样本库中标引词小于3的记录删除。实验结果表明,利用MI方法,分类号与标引词的对应正确率可达72.3%;利用Log L方法,正确率达80.3%[5]

2001年,薛鹏军在进行网页的自动分类研究时,继续采用MI 和Log L方法,结果论证了后者优于前者。在此基础上有所改进的是采用新的筛选标准,他认为:分类号、主题词频次对MI和Log L值的影响程度远不如共现频次显著,即共现频次与MI、Log L值的关联程度较大,所以通过共现频次来进行筛选更具有合理性和科学性。实验结果表明,利用MI方法,分类号与标引词的对应正确率可达57.4%,利用Log L方法正确率达74.5%[6]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈