首页 百科知识 分类语言—主题语言的兼容转换

分类语言—主题语言的兼容转换

时间:2022-02-27 百科知识 版权反馈
【摘要】:这是国内首次对国外分类主题一体化词表进行较为深入的介绍,引起了图书馆及情报界的兴趣。《中分表》是我国情报检索语言兼容性研究的最大成果,也是我国情报检索语言研究的一次飞跃,广泛应用于我国的情报服务领域。结果表明,分类号与主题词的完全相符和基本相符率占36.6%,主题词冗余达40.6%,分类号冗余占13.8%。
分类语言—主题语言的兼容转换_情报检索语言的兼容转换

1.5.1 分类语言—主题语言的兼容转换

1981年,侯汉清撰文介绍Aitchison主编的《分面叙词表》。这是国内首次对国外分类主题一体化词表进行较为深入的介绍,引起了图书馆及情报界的兴趣。在随后的十几年里,国内学者先后发表了百余篇研究论文,探讨分类法与主题法结合的理论与技术。分类主题一体化词表成为国内检索语言研究的一大热点,大量一体化词表陆续出版[44]。汉语一体化词表包括两种类型:一类是分面叙词表,如《常规武器工业分面叙词表》(1983)、《教育分面叙词表》(1987)、《航空航天技术主题词分面表》(1987)、《社会科学检索词表》(1987—1993)、《标准文献主题词表》(1987—1988)、《教育主题词表》(1987—1990)、《中国人口主题词表》(1990—1991)、《音像资料叙词表》(1992—1994)等。另一类是分类表—叙词表双向对照索引,如《文化教育主题词分类表和分类主题词表》(1984)、《中图法》艺术及生物科学大类与《汉表》双向对照索引(1986)、《中国分类主题词表》(1987—1993)及《中图法》与MeSH和《中医药学主题词表》对照表等等。从兼容水平来看,双向对照索引显然不如分面叙词表,但从实际作用和影响来看,后者更受图书情报界的欢迎。其中《中国分类主题词表》影响最大。

1986年,在《中图法》编委会的主持下,我国160多位专家、40多家单位和大量工作人员开始编制《中国分类主题词表》(简称《中分表》),到1994年才编辑完成。该表是在《中图法》第3版(含《中国图书资料分类法》第3版)和《汉语主题词表》(简称“汉表”)基础上编成的分类主题转换工具。《中分表》是我国情报检索语言兼容性研究的最大成果,也是我国情报检索语言研究的一次飞跃,广泛应用于我国的情报服务领域。

研究发现,应用《中国分类主题词表》能在一定程度上实现分类标引和主题标引的转换,直接转换率达86%~92%[45]。1998年,侯汉清等将MARC记录中每篇文献对应的分类号和主题词抽取出来,进行相符性分析。结果表明,分类号与主题词的完全相符和基本相符率占36.6%,主题词冗余达40.6%,分类号冗余占13.8%。但是,随着文献量的增加,新事物、新概念不断出现,《中分表》类目设置固定、增补更新周期较长、词汇较为滞后,不免出现类目词汇冗余和类目词汇贫乏的情况,特别是仿分复分的处理较为简单。造成这种状况最重要的原因是工作人员以主观性分析为基础编表,数据缺乏文献保证。运用机读文献数据库标引数据编制分类号—主题词对照库,具有一定的可行性,既能克服手工编表的缺点,提高词表的文献保障性能,还能极大程度地提高编表效率[28]

1995年,中国医学科学院情报研究所研制的《中国生物医学文献光盘数据库检索系统》(第2版),是一个实用的词汇自动转换系统,为我国研制实用化兼容转换系统积累了经验。该系统可以实现分类号与主题词、关键词与主题词之间的自动转换。但其关键词与主题词的对应、主题词与分类号的对应仍由人工操作,只是由计算机执行转换匹配和检索,使用户不再翻阅印刷版对照索引查找转换词,直接从关键词、主题词、分类号等多个途径检索有关的文献[46]。2001年,建立了中国医学用语—医学主题词对照数据库和中国医学主题词—分类号对照数据库,开发了中国生物医学文献计算机辅助标引系统。2007年,实现了《医学对照表》与“医学主题词—分类号对照表”的整合,初步建立了医学分类主题一体化系统。

1997年,山西省图书馆设计了《计算机文献标引对照系统》(CDIPS)。该系统包括两部分:分类表机读版和标引对照系统(包括《中图法》、《科图法》、《人大法》和《汉表》)。CDIPS较为成功地实现了三大分类法之间、三大分类法与《汉表》之间的相互转换,能够较为方便地为用户提供分类标引之间、分类标引与主题标引之间的转换。CDIPS的成功对于建立我国实用化的兼容转换系统具有重要意义。但是,该系统数据缺乏文献保障,词汇表的对应采用手工操作,智力劳动工作量大,而且没有处理仿分复分问题,界面设计基于DOS环境,用户操作不太方便。

1998年,侯汉清提出建立以《中分表》为核心的检索语言兼容体系,实现各种分类语言、主题语言及自然语言三者之间的兼容[28]。张雪英采用统计学的方法设计了经济信息检索兼容转换两个子系统:经济分类表—叙词表转换系统和经济叙词表—叙词表转换系统[47][48]。事实上,《中图法》和《科图法》有2/3左右的类目可以形成一一对应关系[49]。程鹏从理论上分析了建立《中图法》和《杜威法》对照系统的必要性、解决设想、技术指标和实用性问题[50]。贺定安建议利用现有《中图法》电子版的数据,对原CLCMARC格式进行修改,将国内外分类法的对应类号对应到《中图法》电子版的每一条数据中[51]。李波等[52]根据图书馆MARC数据中分类号与主题词之间的对应关系,通过浏览、统计和分析,利用计算机自动建立了分类法和主题词表转换系统。

2002年,中国农业科学院科技文献信息中心在《农业科学叙词表》的基础上,完成了农业多语种叙词表(AGROVOC)的中文翻译,基本实现了《农业科学叙词表》与AGROVOC词表的转换。2003年,中国中医研究院中医药信息研究所建立了与UMLS功能相似的中医药学及相关学科的语言系统平台。戴剑波利用类目概念因素的相似度原理,编制了CLC与DDC21自动转换系统。2006年,刘华梅实现了多个分类表、叙词表和《中分表》的兼容,构建了教育集成词库。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈