首页 百科知识 元数据的研究

元数据的研究

时间:2022-02-24 百科知识 版权反馈
【摘要】:METS提供了对元数据进行封装的标准,便于不同数字图书馆系统间的数据共享与交换。各种元数据的研究有利于网络信息资源的存取与检索,为用户提供更为深入、更为确切的因特网资源描述;有利于形成高质量、高智能的书目情报系统,满足用户获取资料时的求全、求速、求准、求易的需求;有助于网络时代书目工作者的角色定位,能够主动地参与网络信息资源的组织与控制。
元数据的研究_数字时代目录学的理论变革与发展研究

二、元数据的研究

元数据通俗地说就是目录,“是关于数据的数据。”[29]在卡片目录时代,元数据是一张目录卡片,在计算机时代,元数据就是电子目录。21世纪已不仅要向用户提供实体馆藏的目录,还要向用户提供拥有存取权资源的目录。MARC元数据曾经是目录学史上的一个里程碑,但在网络化数字化环境下传统MARC的缺陷越来越显现,2002年Roy Tennant曾在Library Journal上发文号召淘汰MARC,引发了一场关于是否淘汰MARC的大讨论,其结果正如多年前关于卡片目录是否被机读目录所淘汰的争论一样,没有必要人为地宣判MARC的死刑,而是让其继续与新生代的元数据共存,正如卡片目录与机读目录共存一样,随着时间推移,实现新旧更替。[30]

元数据是用来揭示各类型电子文件或档案的内容及其他特性,具有传统目录的“著录”功能,其作用基本可概括为描述、定位、搜寻、评估和选择。即描述并记录文件的性质与内涵,提供资源的储存位置信息,提供有关如何找到所需资源的信息,帮助用户判断资源价值等,其最基本的功能是提供描述信息。如都柏林核心元数据提供对资源内容、知识产权和外部属性的描述,包括15种基本元素:题名、主题、描述、来源、语种、关联、覆盖范围、创建者、出版者、其他责任者、权限管理、日期、类型、格式、标识。通过元数据可以了解因特网资源类型、Web页面的标题、作者、出版者、主题与关键词等信息。目前,元数据已在图像检索、导航和图像集合中的浏览、声频、视频、地理和环境信息系统、数字图书馆中得到广泛使用。[31]

XML(Extensible Markup Language,可扩展标记语言)是继Html之后的又一种Web标记语言,它为用户提供了灵活的标记扩展机制,使得不同内容的资源能以格式良好的(well form)自定义的标记元素来表现。XML是万维网联盟于1988年创建的一组规范。它是一种元数据语言,用于定义不限定数量的特殊标识语言。它的每种标识又可以有多种属性标识,并且每种标识不限定顺序,具有很大的灵活性。同时由于XML采用可读的英文单词(多数是简写或组合的单词)作为标识符号,因此其格式简洁、可读性强。

MODS(Metadata Object Description Schema,元数据对象描述模式):MODS是美国国会图书馆下属的网络发展与MARC标准机构正在研制的一种针对书目记录元素集的XML模式,它有两大作用,一是能兼容现有的MARC记录数据,二是能创建原始资源的描述记录,MODS采用的是XML Schema语言。MODS不是简单地将MARC数据XML化,而是有所创新,比传统MARC简单,是在MARC与DC之间开辟的第三条道路,MODS的20个元素的定义是由MARC字段简化、组合而来,是MARC的简化版,采用MODS编目将成为数字图书馆信息资源编目的一个候选方案。

DC(Dublin Core,都柏林核心元素集):DC出现于1995年3月,显著特征是简便性和灵活性,避免了MARC的过于专业化和复杂化。DC由标题、作者、主题、出版者、描述、其他参与者、日期、类型、格式、标识、关系、资料来源、语言、内容范围、版权15个核心元素构成,目前主要用于网络资源的编目,DC采用的是HTML,SGML,XML语言,在1997年第4届DC研讨会上,为了更精确地检索信息资源,制定了DC限定词,这使DC的结构变得复杂起来。

METS(Metadata Encoding and Transmission Standard,元数据编码与传输标准):METS是用来将一个数字图书馆中的数字对象相关的描述性元数据、管理性元数据和结构性元数据进行编码的一个标准。对传统的纸质文献,图书馆只需在馆藏数据中记录其描述性元数据信息,缺少该文献组织结构的信息,不会影响该文献的管理与借阅,但是对于数字化的资源,如果仅有描述性元数据而无结构性元数据(即说明数字资源组织结构的元数据),将无法对资源进行有效管理和长期保存,因此METS诞生了。METS提供了对元数据进行封装的标准,便于不同数字图书馆系统间的数据共享与交换。METS采用的是XML Schema语言,由美国数字图书馆联盟DLF(Digital Library Federation)开发,由美国国会图书馆下属的网络发展与MARC标准办公室负责维护。虽然至今METS主要运用于数字对象,但是该标准中没有任何限定只能运用于数字对象,METS适用于任何对象,METS可以容纳2个或2个以上不同类型的元数据。

各种元数据的研究有利于网络信息资源的存取与检索,为用户提供更为深入、更为确切的因特网资源描述;有利于形成高质量、高智能的书目情报系统,满足用户获取资料时的求全、求速、求准、求易的需求;有助于网络时代书目工作者的角色定位,能够主动地参与网络信息资源的组织与控制。目前世界各国图书馆界都在探索能更好地揭示与组织网络信息资源的目录元数据,新生代元数据正在推广与优化中。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈