首页 理论教育 实体检测的规范标准是

实体检测的规范标准是

时间:2022-02-20 理论教育 版权反馈
【摘要】:FRBR的书目模型包括实体、属性、实体间关系、实体及其属性与用户任务的映射关系以及基于FRBR模型的国家级书目记录的基本需求。FRBR将书目记录涉及的实体分成三组,第一组是通过智慧和艺术创作的产品,包括作品、内容表达、载体表现和单件;第二组是对智慧和艺术创作产品负责任的个人和团体,这些个人和团体与第一组中的实体间存在着各种角色关系;第三组实体是产品的主题内容,包括概念、实物、事件、地点、第一组和第二组实体本身等。
二、、、_连续性资源组织

(一)IFLA的《书目记录的功能需求》(FRBR)

书目记录的功能需求(Functional Requirements of Bibliographic Records)的简称,是IFLA于1998年出版的一份研究报告,对书目记录描述的对象在整个生命周期过程中不同阶段的不同实体类型进行了详细的分析,为这些资源的描述、定位提供了完整的思考框架。

FRBR应用“实体—关系”模型(E-R Model)来构建概念框架,为探讨书目记录的结构和关系提供了一个新视点。对沿袭了一个多世纪的编目理论提出了挑战,在编目界引起了强烈反响。

FRBR的书目模型包括实体、属性、实体间关系、实体及其属性与用户任务的映射关系以及基于FRBR模型的国家级书目记录的基本需求。

FRBR将书目记录涉及的实体分成三组,第一组是通过智慧和艺术创作的产品,包括作品(work,一种特有的智慧和艺术的创作,抽象的实体)、内容表达(expression,通过数字、音乐、声音、图像、动作或这些形式的组合对智慧或艺术作品的实现)、载体表现(manifestation,通过物理介质实体化内容表达的实体)和单件(item,载体表现的实例或个体);第二组是对智慧和艺术创作产品负责任的个人和团体,这些个人和团体与第一组中的实体间存在着各种角色关系;第三组实体是产品的主题内容,包括概念、实物、事件、地点、第一组和第二组实体本身等。后面二者是FRBR延伸项目FRANAR(Functional Requirements and Numbering of Authority Records)探讨的核心内容。

第一组是最被关注的对象,因为它是FRBR的核心。

(1)作品(works):作品是一种特有的具有创新性的知识或艺术产品,是一个抽象的实体,需要通过一定的表达方式被感知。如施耐庵的作品《水浒》,指的是创作的内容,而不涉及具体的版本或表现形态。作品的属性有题名、形式、日期、其他可识别特点、内涵等。

(2)表达方式(expression):表达方式是作品得以实现的一种或若干种方式的组合,如文字、音乐、舞蹈、声音、图像等。如电影版的《白蛇传》和越剧版的《白蛇传》,是作品《白蛇传》的两种不同的表达方式。表达方式的属性有:题名、形式、日期、语种、其他可识别特征、可扩展性、可改编性、范围、内容简介、用户权限等。

(3)表现形态(manifestation):表现形态是一种作品内容表达的物质形态。如小说《红楼梦》的精装本、平装本和光盘,分别是这部小说的某一表达方式的3种不同的表现形态。表现形态的属性有:题名、责任说明、版本标识、出版/发行地、出版/发行者、出版/发行日期、载体形式、丛编说明、容器的形式和容载量、检索模式、检索限制、载体表现识别符等

(4)文献单元(item):文献单元是作品表现形态的某一具体物理实体。如某一图书馆有5张电影《西游记》的光盘,那么每张光盘都是1个文献单元。文献单元的属性有:标识号、来源、状况、维护史、获取限制等。

FRBR出版以后,给国际图书馆编目界带来了深远的影响,《国际标准书目著录》(ISBD)、《国际编目原则声明》(Statement of International Cataloguing Principles)、《英美编目条例》(AACR)等随之进行了修订或起草,直到2011年前后才有初步的结果。

我们通常使用的MARC元数据是平面的线性结构,只注重文献的物理形态,无法同时展现作品不同载体、不同内容表达之间的关系;而FRBR则将编目层次上升到以文献主题为核心,更注重书目之间用E—R模型(见图2-2)来分析和定义作品之间实体与属性关系的框架,通过该模型可以清晰定义书目记录中的实体、实体中的属性及各实体之间的关系。FRBR的研究目的有两个:一是提供一个清晰定义的结构化框架,使书目记录中的数据与用户需求之间产生关联;二是推荐由国家书目机构创建的记录的基本功能级别。

图2-2 FRBR的E—R概念模型框架

FRBR的四层书目结构包括“作品(work)”、“内容表达(ex-pression)”、“载体表现(manifestation)”和“单件(item)”。作品(work)是一个抽象的实体,指的是资料对象中包含的内容,不涉及载体形态。内容表达(expression)是通过文字、声音、图像等形式实现作品的方式。对原作品在内容上的任何改动都被视为一种新的“内容表达”。载体表现(manifestation)是对于“内容表达”的实现,每一种“内容表达”都必须有物理实体承载,原作品载体形式一旦发生变化,就会产生新的“载体表现”。目前MARC字段多局限于描述作品的“载体表现”,对于“内容表达”层面的揭示并不多。单件(item)是一种具体物理资料的指代,有时“单件”可理解为“复本(copy)”。以上四者之间的关系如图2-3所示,从“作品”到“单件”是一个由抽象到具体的渐进过程。

图2-3 FRBR四层书目结构模型

(二)IFLA的《规范数据的功能需求》(FRAD)

1999年,国际图联(IFLA)书目记录功能需求(Functional Requirements for Bibliographic Records,FR2BR)研究小组认为有必要扩展FRBR模式以涵盖规范数据,因而成立了“规范记录功能需求及编码工作小组”(Working Group on Functional Requirements and Numbering of Authority Records,FRANAR)。2003年在意大利举行的International Conference Authority Control国际会议中,FRANAR工作小组新任主席Glenn E.Patton发表了FRANAR:A Conceptual Model for Authority Data一文。2005年5月3日Glenn E.Patton又在OCLC举办的FRBR研究会上发表了《FRAR:Extending FRBR Concepts of Auhority Records,FRAR》一文,指出“规范记录功能需求”(Functional Requirements of Authority Records,FRAR)概念模式由书目记录功能需求(FRBR)概念扩展而成。FRAR草案在2005年7月至10月全球征求评论之后,经过修订改名为《规范数据功能需求》(Functional Requirements for Authority Data,FRAD),并增加图示及实体关系的范例,工作小组还在2007年4月推出了新草案,并至7月15日截止征求第二次世界性评论。

《规范数据的功能需求》(FRAD)概念模型,扩充和发展了《书目记录的功能需求》(FRBR)概念模型,对FRBR中确定的第二组实体的属性、关系和用户任务进行了系统、全面的阐述,为使规范记录中的数据和规范记录的用户需求相关联,进一步研究挖掘规范数据的功能要求和规范数据跨行业、跨语言、跨国界的使用潜力,提供了一个结构参考框架。

FRAD认为,规范记录实际上是关于实体信息的集合。FRAD概念模型在所定义的实体方面:包含了两组内容:第一组是FRBR所定义的10个书目实体(著作、内容表达、载体表现、单件、个人、团体、概念、物体、事件和地点),此外还增加了一个档案界所关心的实体——家族(姓氏);第二组是根据规范记录特殊的功能需要,将上述实体的“名称”(如:《石头记》)和分配给实体的“标识符”(如:规范控制号“3452310”),记录在规范文档里的“检索点”(如:《红楼梦》)以及决定“检索点”内容和形式的“规则”(如:“标目法”)和“机构”(如:人民文学出版社),共同定义为5个新的实体。我们可以将这第二组实体理解为FRAD所创造的一种新型的逻辑分组实体。

FRAD和FRBR一样,也是描述“实体-关系模式”,只是把焦点放在规范数据的实体上。实体关系概念模式的构建涉及如何辨识出最重要的实体、每一实体的属性以及实体与实体之间的关系。换言之,概念模式的基本目标在于建立迎合使用者需求的资料结构化架构;而FRAR/FRAD概念模式的目的是为规范记录中所记载的规范数据提供明确的定义及结构,以迎合数据使用者的需求,并协助评估规范数据国际共享及应用。

FRAD还定义了四个用户任务:查找(Find),即使用单一属性、属性的组合或实体间的关系作为检索条件,查找一个实体或一组实体;或使用属性及其关系在整个书目实体世界中查找。识别(Identify),确认描述的实体是否符合目标实体,以区分具有相似特征的实体,或确定受控检索点的名称形式。阐明关系(Contextualize),阐明两个或多个个人、团体、作品等之间的关系;或阐明一个人、一个团体众所周知的名称之间的关系。提供依据(Justify),提供规范记录创建者选择这个名称或名称形式作为受控检索点基础的依据。

在FRAD中涉及了一些名称术语的变化。例如,将“标目”改称为“检索点”,“统一标目”和“相关参照标目”改称为“规范检索点”,“单纯参照标目”改称为“变异检索点”,规范检索点和变异检索点则统称为受控检索点。

FRAD概念模型的研究范围基本涵盖了所有类型的规范数据。主要包括个人、家族、团体、地理实体的规范数据,题名规范数据,主题规范数据。但主题规范数据不是FRAD研究的重点。

FRAD认为规范数据展现了图书馆、博物馆、档案馆等机构通过个人、家族、团体,或具有同一题名的不同版本来组织作品的受控检索点和其他信息。受控检索点包括编目员为识别个人、团体、作品等实体,而收集的这些实体名称的规范形式和变异形式。因此,FRAD将规范数据定义为个人、家族、团体或作品名称的信息集成体,这些名称是参考书目或图书馆目录和书目数据库记录的受控检索点的基础。设计FRAD概念模型的目的主要有两点:一是提供一个明确定义的、结构化的参考框架,这个框架将规范记录创建者制作的数据与用户需求相关联,也就是理论指导规范数据的制作如何更加贴近用户的需求;二是协助评估规范数据的国际共享和使用。

规范记录必须在控制下建构规范名称及异名,当成个人、家族、团体、作品、表现形式、载体呈现、单件、概念、对象、事件、地点的检索项。

有关资料显示,在FRBR所定义的98个实体属性中,能与CNMARC的字段匹配的有88个,匹配率为90%,无法匹配的有10个。因此,FRBR实体属性与CNMARC的描述元素具有基本的一致性。而FRAD共有16个实体,除了包含FRBR的10个实体外,还包括家族(family)、名称(name)、识别码(identifier)、受控检索点(controlled access point)、规则(rules)、代理机构(agency)6个实体。表2-10是6个实体,笔者就此6个实体与CNMARC的描述元素进行比较。

表2-10 FRAD6个实体与CNMARC描述元素比较

(续表)

(三)IFLA的《主题规范数据的功能需求》(FRSAD)

FRSAD是由IFLA组织研究的一项成果。2005年,IFLA成立了“主题规范记录的功能需求”FRSAR工作组,2008年,该工作组发表了FRSAD初稿;2010年6月,分类与标引专业委员会常设委员会核准通过了修订草案;2011年,FRSAD正式出版(见图2-4)。

图2-4 FRBR内容目录

FRSAD从分析用户的需求出发,推导出主题规范系统的任务有4项,即:find(查找)、identity(识别)、select(选择)、explore(探究)。同时,为了协助评估在图书馆领域内外实现主题规范数据的国际共享与使用的潜力,FRSAD提出了一种全新的概念模型——Thema-Nomen模型。在Thema-Nomen模型中,Thema是指所有被作为作品主题的事物;Nomen则定义为任何一个已知、被引用、被标记的主题符号或符号序列(字母数字符号、符号、声音等)(见图2-5)。

图2-5 FRSAD概念模型与Themas之间的语义关系

FRSAD模型即将成为主题规范数据建设的规范标准,完善了《主题规范与参照款目指南》(GSARE)等规范文本。在早期创建实体关系主题规范记录的概念模型时,FRSAR工作组认为有必要分析主题规范数据的用户,鉴别数据使用的上下文环境,特征化不同的使用场景。FSARD认为:“潜在用户群包括:[13]创建和维护主题规范数据的信息从业者,包括编目员和受控词汇创建者;②创建和维护元数据的信息从业者;③参考咨询馆员和其他作为信息检索中介者的信息从业者;④检索信息满足他们的信息需求的终端用户。”

FRSAD模型提供了一个清晰和实用的关系展示方式,有等级关系(属种关系、整体部分关系、类例关系、多等级关系、其他等级关系)和相关关系(见表2-11)。

表2-11 FRSAD相关关系举例

FRSAD的模型,可以将不同文种、不同的主题规范统一起来,实现严格意义上的规范控制。主题规范控制在跨语言环境中具有十分重要的意义。在网络环境下,用户希望图书馆增强各种信息资源之间的知识关联并提供“一站式”服务。FRSAD为了提取文献资源的Thema,必定要对信息资源的内容特征进行更深层次的揭示和组织,把握信息、知识之间的必然联系,使分散的资源和服务实现统一平台检索,满足读者的个性化信息需求。

利用Thema-Nomen模型,不仅方便了用户的检索,还可以主动向用户推荐文献。如果不同语种的文献选用的主题词表达的是同一个概念,就可以通过Thema-Nomen模型发现同类信息资源。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈