首页 百科知识 自然语言—主题语言的兼容转换

自然语言—主题语言的兼容转换

时间:2022-02-27 百科知识 版权反馈
【摘要】:1.5.3 自然语言—主题语言的兼容转换20世纪80年代初,张琪玉教授对后控制词表理论进行了认真的研究和全面总结,系统阐述了后控制词表的概念、作用和编制方法,并提出了一种“分类词表+字顺/轮排表”的结构模式[54]。
自然语言—主题语言的兼容转换_情报检索语言的兼容转换

1.5.3 自然语言—主题语言的兼容转换

20世纪80年代初,张琪玉教授对后控制词表理论进行了认真的研究和全面总结,系统阐述了后控制词表的概念、作用和编制方法,并提出了一种“分类词表+字顺/轮排表”的结构模式[54]。事实上,后控制词表是一种典型的自然语言-主题语言兼容转换系统,关键词法可以通过后控制词表来改善其性能质量[55]

1988年,臧国全首次开发了一个能基于用户提问和建议,实现自学习功能的实验性检索系统。该系统基于关键词倒排档,由人工编制一个初级词表(包含同义词典、准同义词典、等级词典及相关词典),利用学习子系统所产生的聚类词典及收集各方面的建议,对初级机读型词表实行机辅修订,然后得到一个既有“文献保障”又有“用户保障”的质量较好的词表[37]

周荣莲认为,利用词对共现原理来实现关键词的自动聚类建立自然语言叙词表的实验,以文献自动抽词标引的标引词为词表的主要来源,以词与词在文献中的上下文语境联系为依据,辅之以汉语词汇的构造特点和规律等手段构造词间关系,能够建立一个基于文本的自然语言叙词表[41]

韩冬梅也利用词对共现原理及词对相似原理,实现后控制词表的自学习功能[56]。在主题词表的基础上,统计标引的主题词和文本中自由词之间的相似度,加上对用户检索提问的简单句法判断,利用人工智能和专家系统技术获得自由词和正式主题词之间的关系,实现后控词表的自学习功能。

周全明等人利用字面成族原理,在人工分面分析的基础上,采用计算机辅助整理,编制了《汉语题内关键词索引与后控制词表系统》[57][58]。该系统采用人-机结合含糊抽词,以《中图法》类目体系作为词表分类框架,采用字面成族原理,人工分面分析进行词汇归类并设置参照、编制字顺/轮排表。

王源曾在中国化学文献检索系统中利用字面相似性原理计算词间相似度,通过人工辅助判断,建立了“汉英·英汉化学文献标引检索用语词库”[59]。宋明亮提出“分类词表+字顺/轮排表”模式的后控制词表的动态维护,通过计算待归类词与被匹配词之间的字面相似度,按照一定的标准进行词汇归类,辅之以人工判别,实现词表的动态维护[60]

北京文献服务社开发的汉语自动切词标引系统(CWSAIS),包括后控制标引系统(PCVIS)模块。通过对已经人工标引后的文献数据进行统计处理,利用模糊优先比的方法,提取人工标引的经验数据进一步生成语义网络,构造后控制词表。国家科委西南信息中心编制的《中文科技期刊数据库》检索系统,利用同义词库进行扩检。侯汉清教授采用“将自然语言检索标识与某种词表或分类表对应”的方法编制了新闻信息数据库系统后控词表,以《中国分类主题词表》为框架,将标引中积累下来的自由词作为入口词纳入其中,在主题词下建立一个个入口词词群(或称自由词群),并为词表编制字顺轮排表,提供字顺检索途径[61]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈