首页 百科知识 教育集成词库的构建系统研究

教育集成词库的构建系统研究

时间:2022-02-27 百科知识 版权反馈
【摘要】:第4章 教育集成词库的构建系统研究受控词表的互操作,已经成为信息资源开发、利用中的一个全球性问题。针对这些问题进行初步探讨,结合目前的计算机技术,提出建立以《中分表》为核心的集成词库,从而实现各种受控词表之间的互操作。本系统以教育类为实验对象,收集现有的各种词表的教育数据,以《中分表》为核心,通过一定的方法实现其与分类语言、主题语言及自然语言三者之间的互操作,从而构建一个教育集成词库。
教育集成词库的构建系统研究_受控词表的互操作研究

第4章 教育集成词库的构建系统研究

受控词表的互操作,已经成为信息资源开发、利用中的一个全球性问题。我国自20世纪80年代中后期以来在这一方面进行了大量的研究和探索。究竟应当采用哪种互操作的方法,建立什么样的兼容体系,已经成为一个亟待解决的重要课题。

纵观国外正在研究或已运作的项目,如CAMed、MACS、HEREIN、HILT、UMLS等,都是以集合词表或叙词词库的形式来实现各种受控词表之间的互操作;而在国内这方面的研究还很少,90年代初提出的构建“国家叙词库”项目也因故未能完成,目前医学领域在研制的“统一的中国医学语言系统”和“中医药一体化语言系统”可以说是这一方面的一个实例,但该项目的实施更多地依赖手工操作完成,不具有推广性。针对这些问题进行初步探讨,结合目前的计算机技术,提出建立以《中分表》为核心的集成词库,从而实现各种受控词表之间的互操作。

集成词库主要是将某一特定主题领域的若干叙词表或分类法汇编在一起,通过识别等价词及准等价词建立一个词汇转换系统,用于在联合分类或标引活动中实现分类法和叙词表之间的互操作1。采用集成词库的方式实现受控词表之间的互操作,首先,可以将各种词表或类表全部收集、利用起来;其次,不需要对原词表和类表进行加工,主要通过发挥计算机联机显示、统计及转换等功能,实现互操作;第三,也无须建立完全等价的对应关系,只要表现出所有相关及同义关系即可;最后,还可以随时添加新的兼容词表,不断扩充词库。

本系统以教育类为实验对象,收集现有的各种词表(含分类表、主题词表、关键词等)的教育数据,以《中分表》为核心,通过一定的方法实现其与分类语言、主题语言及自然语言三者之间的互操作,从而构建一个教育集成词库。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈