首页 百科知识 国外受控词表互操作研究状况

国外受控词表互操作研究状况

时间:2022-02-27 百科知识 版权反馈
【摘要】:近年来,各国围绕知识组织系统互操作问题进行了大量的研究和试验。受控词表的互操作问题越来越复杂,多部分类法、主题法以及自然语言之间的互操作目前已经成为国外研究的热点,学术界实施了许多积极而有效的研究计划,一些研究成果已在实践中得到应用。
国外受控词表互操作研究状况_受控词表的互操作研究

2.1 国外受控词表互操作研究状况

国外对受控词表的互操作问题进行了长期、深入的研究。最初提出的是受控词表之间的兼容互换问题,关于这方面的研究文献在国际上最早出现于1962年。当时美国的一些学者对不同机构所用的受控词表进行了多次转换研究。1971年10月,世界科学技术情报系统(UNISIST)召开的111个国家,62个国际组织参加的大会上,兼容问题得到了相当的重视,会议通过的报告指出:“需要研制一些更好地控制和转换自然语言和情报检索语言的工具”1。此后,在多次国际性会议上都讨论了兼容问题,如1977年9月6日至8日在Lalvia召开的“情报检索语言统一系统”会议上,提交了54篇关于检索语言兼容的论文;1977年5月7日,欧洲共同体在卢森堡召开了“情报系统和网络第三次会议:语言障碍的克服”;国际文献联合会(FID)下属组织分别于1980年夏天召开了两次“情报检索语言兼容专题讨论会”2。进入80年代,受控词表的兼容与互换问题更受重视,关于兼容与互换的理论、模式与方法等都成了热门的研究课题。

进入90年代后,随着网络信息的急剧增长,为了实现不同情报系统的资源共享,对受控词表互操作的研究变得更为迫切,并提出了知识组织系统(Knowledge Organization System,KOS)的概念,知识组织系统是对人类知识结构进行表达和有组织地阐述的各种语义工具的统称,包括分类法、叙词表、语义网络、概念本体以及其他受控词表与标引语言。知识组织系统互操作性是指两个或多个系统相互使用已被交换的信息的能力,就其本质而言,互操作性是对异质实体(包括异种体系结构、异种操作系统、异种网络和异种语言等)中可获得资源的透明调用的能力3。近年来,各国围绕知识组织系统互操作问题进行了大量的研究和试验。在各种国际性会议和学科门户网站上都报道了知识组织系统的互操作问题,主要解决的问题就是在各种不同受控词表、不同结构的知识组织系统中建立互操作,包括不同分类语言之间或不同主题语言之间,以及分类语言和主题语言之间实现互操作等等。

进入网络时代,发展到知识组织系统后,各国都非常重视互操作的问题,各国国家标准、国际标准都逐步将受控词表互操作的内容纳入到词表标准范畴中,更说明了该项研究的重要性。美国国家标准Z39.19(单语种受控词表编制、格式与管理规则),2005年进行了全新修订,其中第10部分即为互操作,详细分析了影响互操作的因素,多语言受控词表,互操作在标引、检索中的应用,集成受控词表,互操作结构的存储和维护等内容;另外还在附录D中列举了实现互操作的方法,如:抽取/模型,翻译/应用,微词表/宏词表,直接映射,同现映射,转换/中介词典,融合/集成词表,链接等4

英国国家标准BS 8723(Structured vocabularies for information retrieval,用于信息检索的结构化词表),是英国标准局2005年开始发布的多语种结构化词表标准,全面取代了发表于1987年的单语种词表标准BS 5723。其中,BS 8723的第4部分是词表之间的互操作,指导不同类型词表之间的映射,包括:①同一语种不同方言区叙词表互操作;②单一语种不同叙词表之间的互操作;③叙词表和其他结构化词表(比如分类法)的互操作;④具有同样结构和功能的词表之间的互操作。第5部分是交换格式和互操作协议,是全新的内容,提供便于数据交换的数据模型和格式5

2007年4月,国际标准化组织(ISO)开始以BS 8723为基础将ISO2788(单语种叙词表构建和开发)和ISO5964(多语种叙词表构建和开发)进行更新和扩展,命名为ISO 25964(Thesauri and Interoperability with other Vocabularies,叙词表及与其他词表的互操作)。ISO 25964由两部分组成,ISO 25964-1:用于信息检索的叙词表;ISO 25964-2:与其他词表的互操作,包括许多其他词表以及叙词表与它们之间的映射6。其中,ISO 25964-1对叙词表数据模型、叙词表互操作等规定处处体现了与其他知识组织工具的协调和映射;ISO 25964-2中将进一步详细规定不同类型词表间的互操作,包括叙词表和其他词表如分类体系、分类法和本体等的互操作,还将提供实际映射和体系结构上的指导。ISO 25964-1已于2008年底推出了ISO CD 25964-1(ISO技术委员会草案),并面向各国广泛征求意见。ISO 25964-2还没有相应的标准文本7。

另外,2005年W3C公布的推荐标准SKOS(Simple Knowledge Organization System,简单知识组织系统),主要用于表示和描述各种知识组织系统,如叙词表、分类法、主题词表、术语表等,从而实现资源的共享和重用。SKOS包括三个主要部分:SKOS Core,SKOS Mapping,SKOS Extensions。其中的SKOS Mapping中定义了五种概念间的映射关系(broadMatch,closeMatch,exactMatch,narrowMatch,relatedMatch),用来实现不同词表间的互操作。目前该标准尚处于工作草案阶段8

受控词表的互操作问题越来越复杂,多部分类法、主题法以及自然语言之间的互操作目前已经成为国外研究的热点,学术界实施了许多积极而有效的研究计划,一些研究成果已在实践中得到应用。表2-1中总结了近年来一些欧美国家所进行的主要研究项目9

表2-1 分类法主题法互操作项目一览表

img3

续表2-1

img4

续表2-1

img5

续表2-1

img6

2.1.1 国外分类语言互操作的研究项目

DDC首创于1876年,是世界上流行最广、影响最大的图书分类法,经过逐步地修订、补充、提高和完善,至今已出版到22版。1993年,DDC编辑组就开发和出版了MS-DOS版的“电子杜威”;1994年出版窗口版“视窗杜威”;1996年第21版DDC分印刷版和光盘版两个版本;2000年发布“视窗杜威”2.10版10;此外,还在因特网上建立了DDC的网页。目前已被全球超过135个国家和地区的图书馆使用,并且被翻译逾30种语言,成功地应用于MARC、WorldCat和LIN等联机书目系统以及图书馆书目系统中,并被大量情报机构研究实现了与很多图书分类法的互操作。

(1)SAB/DDC

1987年瑞典皇家图书馆就完成了瑞典图书分类法(SAB)和DDC19的互操作,并以书本形式出版发行。2000年至2001年瑞典皇家图书馆又实现了DDC21和SAB7分类号间的转换,采用人工智力的方法来完成类目之间的对应,将结果保存在小册子里或联机数据库中,成功应用到瑞典图书馆联合目录LIBRIS系统中,另外,还成功的应用到网络检索中,对那些只熟悉SAB或DDC一种分类法的用户有很大的帮助11

(2)MSC/DDC

1995年,纽约州立大学对美国数学协会的《数学主题分类法》(MSC)与《杜威十进分类法》(DDC20)510(数学)进行了映射研究。映射结果包括:准确匹配、专指到泛指、泛指到专指、多对一、循环映射、无匹配以及下位和上位映射。它是通过比较和分析两种分类法的异同,设计一种面向对象的、基于框架分析的专家系统软件,来实现两种分类法间的映射。

(3)Renardus12

Renardus项目是信息社会技术项目、欧盟第五框架计划项目的组成部分,来自丹麦、芬兰、德国、法国、瑞典、英国等七个国家的国家图书馆、研究中心及主题网关等机构参与,由荷兰国家图书馆负责协调工作。参与项目的10多个主题网关采用的分类体系不尽相同,主要有DDC、LCC以及专业分类法(如Ei分类法)与本地网关自编的分类法(如荷兰基础分类法BC、G9ttingen联机分类法GOK)等。项目的宗旨是开发集成式的网络信息资源门户,使用户通过一个单一界面,能够跨库浏览和检索遍布欧洲的分布式主题网关内的网络学术资源,其建立的门户网站选用DDC作为不同分类法的交换语言,将各个对象网关的分类法映射到DDC上,并将信息资源按DDC的等级显示出来,在每个等级上还用扇形图对所含类目进行形象直观的描述,并选用都柏林核心元数据统一描述信息资源。Renardus项目成果实现了基于DDC的跨库浏览13

在Renardus项目中,根据类目之间的语义关系,定义了5种映射关系:完全对等(Fully Equivalent)、下位概念关系(Narrower Equivalent)、上位概念关系(Broader Equivalent)、大部分重合概念关系(Major Overlap)、小部分重合概念关系(Minor Overlap),提供从DDC到局部分类体系的单向映射。利用CarmenX工具人工判断类目之间的映射关系,并以记录形式存储类目映射关系。最后,Renardus采用单一的界面,即代理服务系统(Renardus Broker)来浏览和检索项目中各网关所著录的信息资源,而这种代理服务系统利用DDC类目作为浏览体系。

Renardus跨库浏览的目的是允许用户通过DDC等级主题导航并从中选择类别,跳跃到本地网关中的相关(映射)类别与资源。用户浏览的每个页面的上半部分显示在DDC等级体系中的可用类目,包括所有的上位类目和下位类目,下半复分列出网关中的收录相关资源的链接,包括本地类目的类名、分类号等。可通过DDC扇形图(Graphical Navigation Overview)显示出所选类周围的所有可用类目,并用突出颜色显示所选类目。用户通过浏览与检索DDC界面,选取类别,就会显示映射的其他局部分类法,再通过链接实现跨库检索各主题网关的学术资源。

国外数字图书馆研究项目和一些门户网站信息的共享研究项目中,由于需要浏览和检索分布在不同地域、采用不同受控词表组织的电子文献资源,而检索者希望通过一个浏览检索界面来完成,系统就需要提供不同情报语言转换的部件,使用户利用某一熟悉的情报语言可以浏览和检索用不同情报语言处理的数据。系统所提供的不同情报语言转换部件除了是利用人工智力映射的成果外,也有采用计算机自动实现分类法互操作的成果。

分类法之间的自动转换一般利用书目数据库记录或分类文档(这些记录中的对应关系本身就是人工经验的集合),例如OPACS以及其他一些分类数据库中的记录等,根据记录中分类号之间的对应关系、经计算机自动抽取形成对应表,为了优化分类号之间的对应关系,利用统计的方法或其他一些相关性算法来确定最佳的对应分类号。标引资源时,利用分类号对应表,只需要输入一分类号,便可以输出或变换成相对应的分类号或与分类号相关的主题词。例如LCC和Nederlandse Basisclassificatie(BC)之间的转换,由于事先建立好了LCC与BC的对应关系,当国会分类号LCC的记录进入到Pica OPAC时,系统能自动变换成BC分类号,与此类似的还有UDC和BC的转换。在Krause/Marx 2000的研究中,还采用了基于同现统计、神经网络等方法来实现不同受控词表自动转换14。

2.1.2 国外主题语言互操作的研究项目

(1)LCSH/MeSH

LCSH/MeSH映射项目是Northwestern大学从1990年至今一直在研究的项目。该项目最初的目的是通过整合这两个受控主题词表,以解决图书馆的在线编目中因采用不同受控词表而产生的不兼容性。第一批LCSH和MeSH的映射项目已经完成,是利用计算机辅助技术和人工判别的方法来完成两标题表的映射。它是以MARC21权威记录格式来实现的,150字段用来存放源记录中的标题词,增加了750或788字段,用来存放链接款目,即目标记录中的映射标题词。经过这种映射方法,MeSH到LCSH的映射结果大约覆盖了11 000篇LCSH文献;同样地,LCSH到MeSH的映射结果大约覆盖了9 700篇MeSH文献,这些文献记录和映射数据都保存在Northwestern联机目录中。随着LCSH 和MeSH标题词的不断增加、改变和删除,映射数据也在不断更新中15

(2)CAMed项目

CAMed(Complementary and Alternative Medicine),是一个国际合作项目,由哥伦比亚大学和肯特州立大学主持,是对医学资源的补充和选择。它包括一个集合词表管理系统和跨词表检索系统。在这个模型中,医学领域的4种叙词表经过规范化并存储在一个词表知识库中。系统允许数据库管理者在自己的国家通过网络界面来管理和编辑自己的词表,然后提交到肯特州立大学的总服务器存储和管理。系统的跨词表检索机制允许用户输入一个检索词,可以同时检索到这个知识库中的所有或任何一个词表;系统经过匹配检索词和词表中的词,然后反馈给用户一些“全部匹配”和“部分匹配”的叙词款目;用户从检索结果中选择自己想要的词,并可以看到这个词在词表中详细资料(包括它的上下位词、相关词和非正式叙词),并可以继续选择显示出来的词;最终可以通过这种语词检索实现在知识库的4个词表中的直接检索。目前这种检索机制扩展到了CAMed网上信息资源的全文检索16

(3)MACS项目

MACS(Multilingual Access to Subject)项目由法国、德国、英国、瑞士的国家图书馆共同完成,其目的是把德语(SWD)、法语(RAMEAU)、英语(LCSH)这三个主题标题表中概念相等的标题词之间建立相等关系的链接,并把这种链接关系存储到链接数据库中,使检索用户可以采用自己喜爱的语言检索利用四国主题标题表所生成的书目数据,克服检索词的语言障碍,实现图书资源的共享。

在MACS系统中,系统强调各参与项目的机构独立自主地管理各自的标题表,并不是把所有标题词统一或合并存储在一起集中管理。虽然用合并集中管理的系统容易管理,并可以由编辑的机构统一控制各种关系,在使用中也更容易达到一致,但是由于各标题表的特殊性,即都是该国国家图书馆使用的标题表,如果要求参与该项目的机构放弃管理维护他们各自的标题表,这显然是行不通的。完整的MACS管理系统由几个不同的又相互链接的数据库组成。

在系统的周边是由各管理机构独立管理的标题表数据库以及采用该标题表标引的书目数据,参与该项目的机构单独全权地维护管理各自标题表。MACS系统一般对这些数据有只读权限,系统的核心是MACS的链接数据库。链接数据库中的链接关系由各机构自主编辑提供,链接关系数据通过网页访问来集中。链接数据库中包括了很多的链接,也称为表达式簇。在大多数情况下,表达式簇中某标题表中的单个标题词即是一个表达式,并在其他标题表中能找到与之存在近似相等关系的、由单个标题词构成的表达式。但是也有一些标题词在其他词表中未必都能找到与之近似相等的标题词,在这种情况下则对其他表的标题词用“OR”或“AND”组配得到近似相等的表达式。各参与机构可以及时维护链接关系,以保证较好的时效性17,18

(4)HEREIN项目

HEREIN(The European Information Network on Cultural Heritage Policies)项目是从欧洲关于文化遗产政策的报告中抽词,创建一部国际语言的叙词表。词表的创建没有直接参照任何已经存在的词表语词或词表结构。首先是分成三个小组———西班牙、法国、英国,分别负责建立它们自己语言的叙词表。然后通过比较三个小组的语词,确定语词间关系,从而建立三种语言的叙词表。词表可以使用户更好地了解文化遗产领域的术语,有助于用户阅读专业报告及进行相关扩展检索19

2.1.3 国外不同类型受控词表之间的互操作研究项目

在20世纪70年代以前,分类语言和主题语言是作为两种情报语言独立存在和发展的。两者在外部形式、内部结构、组织方式和标引方法等方面存在很大差异。在功能上也各有所长,各有其短,不能互相替代。为了充分发挥分类语言和主题语言各自的优势,满足信息检索的不同需求,图书情报界为寻求分类法和主题法两者的有机结合进行了长期不懈的探索。

早期的分类法系统和主题法系统从问世起就已注意吸收对方的优点,采用对方的编制原理和方法,在其漫长的发展过程中,两者相互渗透、相互融合。20世纪60年代中期以后,国外对分类法和叙词表进行的大量抽样调查和试验,开始了真正意义上的分类主题一体化理论研究。

1969年,英国的艾奇逊(J.Aitchison)和戈默索尔(A.Gomersall)等成功地将《英国电气分面分类法》改编成《分面叙词表:工程及相关学科的叙词表和分面分类法》。《分面叙词表》包括分面分类表和叙词表两大部分,每个叙词(即类目)同时出现在这两部分之中,两部分之间用分类号相联系,真正做到了分类法和主题法一体化。由于这种词表具有多种功能,既可用于分类标引,也可用于主题标引;既适用于手检系统,也适用于机检系统,受到图书情报界的极大重视和好评。在《分面叙词表》的影响下,英、美等国陆续出版了一批分类主题一体化词表。

进入90年代后,随着计算机技术和网络技术的飞速发展,分类语言和主题语言兼容互换的研究又成为热点,国外进行了大量的试验和研究,构建了很多成功的一体化系统。

(1)DDC/LCSH

DDC与主题词表对应的研究项目有很多,对应的主题词表基本以LCSH为主。1994年,OCLC机构开始研究LCSH和DDC的转换问题。D.V.Gotz等应用统计学和计算机技术相结合的方法进行了LCSH标题词和DDC分类号之间的自动对应转换。它是采用同现映射的方法来实现的,首先从WorldCat(联机联合目录)上下载DDC/LCSH词对记录,这些记录同时包括DDC和LCSH分类号。然后采用极大似然估计法(LogL)计算DDC和LCSH的相关度,从而生成LCSH和DDC的对照数据库20。Dewey for Windows,是DDC21版的微软Windows版本。在视窗杜威分类法中,每个类号最多可对应五个标题词,编辑人员还把选择的LC主题标目加入电子索引中。

2000年OCLC推出了杜威分类法的网络版WebDewey,WebDewey包含多种方式映射到DDC类号约90000个标题,即由DDC编辑映射的LCSH标题和儿童标题表(LCSHac)的标题,OCLC的Netfirst(因特网信息资源目录)中由人工映射的LCSH标题,根据OCLC的WorldCat记录中标引的杜威分类号和LCSH标题,由计算机依据特定算法自动统计映射的LCSH标题21;以及“视窗杜威”中统计映射的LCSH标题,WebDewey还建立了从映射的LCSH标题到LCSH规范档的链接。

OCLC还实现了DDC和《加拿大标题表》(Canadian Subject Headings,CSH)的映射,目的是用DDC查找加拿大主题的术语。每个月,杜威编辑映射组都会随着DDC、LCSH和CSH新版本而及时更新映射类目22。DDC、LCSH作为国际通用的分类法和主题词,它们之间的互操作为用户在主题编目、分类、资源共享方面提供了很大的方便。

另外,OCLC为增强DDC主题处理能力、新概念词的处理能力以及DDC网络适用性,对DDC进行了一系列主题词对应转换研究。DDC改进主题处理能力主要是从两个方面进行,一是把DDC和其他的主题词表进行对应,Extended Concept Trees就是增强与其他主题词表对应转换的研究项目,它把DDC与LCSH 和LCC连接起来。如把DDC的相关索引词与LCSH的正式主题词对应起来,把一个特定的DDC类目与LCSH的同义词和其他的变体相对应,扩展与DDC类目相关的词汇和术语。二是把自由文本中最新的最终用户术语与DDC对应。WordSmith研究项目旨在建立一组自然语言分析工具,可以从WEB文本中自动地提取新的概念词语,并自动形成与DDC类号的对应。

(2)HILT项目

HILT(High-Level Thesaurus Project,高层叙词表项目)是由英国JISC(联合信息系统委员会)和美国RSLP(研究支持图书馆计划)创建的项目,UKOLN(英联邦图书信息网络办公室)、The MDA(博物馆联合会)、NCA(国家档案委员会)、OCLC等单位参加,项目开始于2000年9月1日。该项目主要是研究用不同知识组织系统组织的网络信息资源的检索和浏览问题,通过建立一个转换机制在不同知识组织系统之间提供服务,实现跨库、跨领域的信息检索和浏览。系统服务机构包括档案资料界、图书馆、博物馆、在线信息服务以及其他一些单位。2001年提出开发映射服务,就是利用现有的主题表、叙词表、分类法,如LCSH、UNESCO、DDC、UDC、AAT等,通过导向映射服务技术实现各词表及其词表与分类表之间的互操作。

用户输入自由款目词,系统首先转换为首选的叙词表的款目词。由于各叙词表、分类表之间通过映射服务实现了互操作,然后系统会根据得到的主题词转换成参加项目其他机构所采用的叙词或分类号,并利用经过转换得到的叙词或分类号在系统中进行主题浏览和检索,从而实现了跨库跨领域检索23,24

该项目最主要内容是各情报机构的受控词表之间的映射,基本可以分为主题词表之间的映射、主题词表和分类法的映射。现以UNESCO和MeSH,UNESCO、LCSH和DDC在“健康部分”的映射来说明,词表和词表之间款目词的映射分为8种关系,分别是不匹配(NM,NO Match),完全匹配(EXM,Exact Match),完全参照匹配(ECM,Exact Cross-reference Match),继续澄清匹配(FCM,Further Clarification Match),语义匹配(SFM,Semantically Factored Match),上位概念匹配(SPM,Superordination Match),下位概念匹配(SBM,Subordination Match)拼写差异匹配(SVM,Spelling Variation Match)。

(3)UMLS项目25

UMLS(Unified Medical Language System,一体化医学语言系统),是由美国国家医学图书馆(NLM)1986年开始研制至今的项目。UMLS是计算机化的受控词表集成系统,它不仅是语言翻译、自然语言处理及语言规范化的工具,而且是实现跨数据库检索的词汇转换系统,它可以帮助用户在连接情报源,包括计算机化的病案记录、书目数据库、事实数据库以及专家系统的过程中对其中的电子式生物医学情报作一体化检索26。UMLS知识资源包括三部分:超级叙词表(Metathesaurus)、语义网络(Semantic Net-work)、专家词典(SPECIALIST Lexicon)。

超级叙词表是UMLS的核心词汇部分,是生物医学概念、术语、词汇及其含义、等级范畴的广泛集成,是包括生物医学概念语义信息(各种名称以及他们之间的关系)的一个数据库,它的数据来源于多种语言多部生物医学受控词表、分类表、术语表、专家系统,通过在这些知识组织系统间进行互操作建立的。超级叙词表依据概念(Concept)或意义(Meaning)为中心来组织信息,基本保留了各个来源词表的结构和词汇信息,其目的是要将同一概念的各种名称(同义词)和形式(单复数、形容词等)联系在一起,并标识不同概念之间的关系。1997年第8版的超级叙词表收录了来源于30多种生物医学词表和分类表的能表达33万多个概念的739 439个词汇。2001年版收录了来自60多个生物医学受控词表、俗语表、分类表、专家系统等的80万个概念共190万个词汇27。2007年11月推出的版本2007AC收录了来源于100多种词典、分类表、叙词表、专家系统等能表达100多万个概念的500多万个概念名称。因此,概念可以说是超级叙词表的核心。对于同一概念的不同术语、术语的不同变异词串形式以及词串的不同来源,超级叙词表采用三级结构模式来表达概念内词语关系,即概念(concept)是一级、表达同一概念的不同词语(term)为二级、同一词语的不同变体即词串(string)为三级。三者通过概念标识符(CUI)、词语标识符(LUI)、词串标识符(SUI)相连,将一个概念的多种不同术语连同多个变异词串有序地组织在一起28

语义网络则是为建立概念术语间相互错综复杂关系而设计的,它包括语义类型和语义关系两个部分,是为超级叙词表中所有概念提供语义类型及相互关系结构的工具,超级叙词表中的每一个概念至少被标引一种语义类型。目前语义网络包括135种语义类型和54种语义关系。语义类型的高层分为“物”和“事”两大类,并由此层层展开形成树状结构;最基本的语义关系是“isa”关系,它是一种等级关系,另外的53种相关关系,主要分为五大类:物理上相关、空间上相关、时间上相关、功能上相关和概念上相关。

总之,UMLS通过字、词、术语、概念、语义、语用的一体化,对概念词进行了不同层次、不同角度的控制,实现各类型受控词表,包括分类语言和主题语言、自然语言和受控词表、不同语种和功能受控词表的一体化,真正体现了它在专业词汇控制、计算机自动编制词表和超级叙词表数据应用于智能化交互程序等多方面的综合功能29。

UMLS的经验表明,利用国内外现有的各种叙词表、标题表、关键词表、分类表、数据库、专家系统以及各种辞书、工具书等,创建一种综合化超级知识库已有了基础。在此基础上建立的受控词表能满足不同类型、不同层次用户的检索需求。即允许用户在检索提问中使用不同类型的自然语言,也可使用自己熟悉的受控词表(主题语言或分类语言)检索和组织信息。而在系统的内部,由受控词表负责对用户自然语言的提问进行转换、链接,从而支持标引、查询、检索、浏览、组织信息的全过程。另外系统还可随时显示语义网络、词义、词间关系,指导用户进行扩检和缩检,最后能自动按检索相关度组织输出结果。

UMLS可以在信息检索、叙词表构建、自然语言处理、自动标引等方面得到应用,已在PubMed检索系统中成功应用。目前,可以通过索要DVD光盘安装访问,或通过Internet的UMLS知识源服务(UMLSKS)在线访问UMLS。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈