首页 理论教育 数字信息资源组织的原理

数字信息资源组织的原理

时间:2022-03-10 理论教育 版权反馈
【摘要】:描述与揭示是数字信息资源组织的重要内容,在数字信息资源组织中起着至关重要的作用。一般而言,对数字信息资源组织形式特征进行描述的过程称为著录。标引是一项传统图书馆的信息组织工作,对于数字信息资源组织来说,同样适用。其中主要有两种基本方法用来标识数字信息资源:一是URN,是赋予数字信息资源一个唯一的名称,即统一资源名称;二是PURL,是赋予数字信息资源一个固定的位置,即永久统一资源定位器。

4.1 数字信息资源组织的原理

4.1.1 数字信息资源组织的含义和内容

数字信息资源组织,是指依据数字信息资源的固有特征,运用一定的方法和技术,对其进行揭示和描述,为数字信息资源提供有序化结构的过程。数字信息资源特征包括外部特征和内容特征。数字信息资源的外部特征一般是指信息载体的物理形态、题名、责任人、出版事项等。在信息组织中,记录信息外部特征称之为描述,即根据特定的信息管理规则和技术标准,将存在于某一物理载体上的信息记录的外在特征进行选择和记录的过程。在这一过程中,若干著录事项按照一定的规则和格式组织起来,便形成了关于某种信息资源的信息款目。数字信息资源的内容特征一般是指学科专业或主题概念,在信息组织中,对信息的内容特征进行的加工和整序称之为揭示或标引,是在分析信息内容的基础上,根据特定的标引规则与工具,赋予信息内容一定标识,以便将信息记录组成概念标识系统的信息处理过程。无论是信息描述还是信息揭示,都是将无序的信息整理成为有序的信息,实现无序信息流向有序信息流的转换,使之形成更高级的信息产品,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。

从形式上看,数字信息资源组织与传统文献信息组织并无太大区别,但是,其基本内容与传统文献信息存在一定的区别。数字信息资源组织内容包括优化选择、描述揭示、确定标识和整理存储。

(1)优化选择

选择是数字信息资源组织的第一步。数字信息浩如烟海、优劣杂糅、真伪混同。所谓选择是在浩瀚的信息海洋里发现并确认具有组织、整理和保存价值的信息。从信息管理的角度来看,信息资源选择是根据用户的需要,从纷繁复杂的信息中把符合既定标准的一部分挑选出来的活动,是以选择主体对数字信息资源现象的认识为前提的,是人的主观认识与客观现实的相互作用(1)

由于数字信息易于生成、复制与传播,在信息生成阶段,又缺乏像传统文献信息生成所具有的那样一个完善的选择、评价制度,故数字信息的质量与价值参差不齐,若不进行有效的评价和筛选,质量高的、有价值的信息难以被有效组织。因此,对数字信息资源进行整理,提高信息质量,并控制信息的流量流速,就必须进行优化选择。

优化选择应根据用户的信息需求,结合优化选择数字信息资源的标准,把真实可靠的、先进的、适合用户需要的信息挑选出来,剔除无用信息,为数字信息资源的组织奠定一个良好的基础。

(2)描述与揭示

描述与揭示是数字信息资源组织的重要内容,在数字信息资源组织中起着至关重要的作用。一般而言,对数字信息资源组织形式特征进行描述的过程称为著录。这个过程如同传统文献编目工作,其数据要按照一定的逻辑以一定的格式形成款目。对于数字信息资源而言,人们比较热衷于让信息的责任者在元数据的框架下自行描述,像OCLC的“都柏林核心”最初构思就是为了建立一种由作者来生成的网络资源描述框架(2)。对数字信息资源内容特征的揭示称为标引,是数字信息资源组织的专业化工作,是在分析信息内容属性及相关形式属性的基础上,用特定的检索语言(如分类语言、主题语言)表达分析出的属性和特征,并赋予信息检索标识的过程。

标引是一项传统图书馆的信息组织工作,对于数字信息资源组织来说,同样适用。无论是传统图书馆的信息组织,还是数字信息资源的组织,其目的都是为了保障信息的有效组织和提高信息的检索效率。标引一般包括两个环节:一是主题分析。即了解文献内容及其表现形式;选择标引所针对的各个内容单元;概括单元内容,形成自然语言表述的主题概念;分析主题概念的结构、类型、学科属性。二是主题转换,即用检索语言的语词来表达主题分析过程中所提炼的主题概念。

(3)确定标识

为每一件数字信息资源确定检索标识,建立数字化信息资源的标识体系,是数字信息资源组织的又一重要内容。检索标识,是以简练的形式表征的信息特征,目的是用以区分和辨识信息,作为有序存储和检索信息的依据。无检索标识的信息,不能形成检索系统,也不能有效地对之进行检索。与传统的文献信息不同,数字化信息复杂,其利用和处理需要依赖一定的格式和环境,而且,在数据层面上,数字化信息还可以与另一个信息单元相联系,形成一种网状结构。在网络环境下,数字信息处于一种无序状态,同时,数字信息又是一种动态信息,因而,确定数字信息资源的标识,对于建立一个有序的数字化信息资源保障体系十分重要。目前,网络信息资源的标识符主要有:URL、PURL、统一资源名称(Uniform Resource Names,URN)、统一资源标识符(Uniform Resource Identifier,URI)、数字对象标识符(Digital Object Identifier,DOI)、串行数据项和基值标识符(Serial Item and Contribution Identifier,SICI)编码等。其中主要有两种基本方法用来标识数字信息资源:一是URN,是赋予数字信息资源一个唯一的名称,即统一资源名称;二是PURL,是赋予数字信息资源一个固定的位置,即永久统一资源定位器。

(4)整理存储

对给定检索标识的数字信息进行整理,将内容相同的集中在一起,不同的区别开来,组织成为一个条理清晰、层次分明的信息系统之后,还应将这些信息按照一定的格式和顺序存储在特定的载体中,如各种光盘检索系统、联机检索系统、数据库、学科信息门户、网络检索工具等都是数字信息存储的方式。利用新型载体存储数字化信息,可增强数字信息资源的可控性、有序性和易用性,为高效率地利用数字信息资源提供条件。

4.1.2 数字信息资源组织的目标、原则

(1)数字信息资源组织的目标

庞杂的信息资源与人们特定信息需求的矛盾是信息交流的基本矛盾,这种矛盾早在信息交流活动诞生之日起就存在着,只不过在早期的信息交流活动中,由于信息量有限,信息需求单一,信息资源与信息需求之间的矛盾并不突出,文献信息的搜集、整理和查找工作基本上由科学家本人完成,科学信息交流也是在科学家之间进行。然而,伴随信息量的增长,信息需求的多样化,科学家想从杂乱无章的信息中获得所需信息就显得力不从心了,于是就有了对信息组织的需求。在不同的时期,图书情报部门为满足不同用户的信息需求采取了不同的信息组织方法。早期,图书馆基本上是采用线性的分类方法来组织文献信息,其主要成果是:藏书排架;编制和维护作为馆藏检索的主要途径的目录。在联机目录出现之前,图书馆的主要目录形式是卡片目录、书本式目录或者计算机输出缩微格式目录(COM),虽然有的图书馆还有其他补充目录,但是,其检索的局限性仍然很大,用户难以进行多途径、多因素检索,难以进行任意因素的检索。即便是联机目录也只包括图书馆系统中收藏的文献单元。如今,庞杂且无序的数字信息在网络环境下,好像是堆满图书但没有目录的图书馆,数字信息资源的组织对信息组织者来说是一个重大的挑战。组织是人的本能,人类的学识积累离不开对数据、信息和知识的分析和组织,而且数个世纪以来积累的组织文本信息的经验也可以加速对数字信息资源的组织过程。随着信息技术的发展和用户信息需求的变化,个性化信息服务的趋势愈来愈强劲。在个性化信息需求日益强烈和信息服务个性化快速发展的情况下,基于个性化服务的数字信息资源组织就显得特别重要。如何满足用户的个性化和专业化的信息需求,探求面向语义的数字信息资源组织技术与方法,提供面向语义的信息服务,则成为人们关注的焦点。数字信息资源组织的目标就在于利用最新的Web技术,实现面向语义的信息检索,最大限度地满足用户的检索需求。

(2)数字信息资源组织的原则

与传统的文本信息的组织一样,对数字信息资源的组织,也必须在一定的科学原则的指导下,切实避免数字信息资源组织工作的随意性、无计划性和盲目性,从而使数字信息资源组织真正达到优选、有序,实现科学分流、有效利用的目的,形成结构合理的信息组织体系和顺畅通达的信息组织流程。为此,基于个性化服务的数字信息资源组织必须遵循如下原则:

①目的性原则。基于个性化信息服务的数字信息资源的组织具有鲜明的目的性,即以用户为中心,紧密围绕用户的信息需求开展工作,注意信息机构的目标市场的需求状态及其变化特征。要从有效、可靠、可持续地提供和保障用户所需服务的角度出发,进行信息资源建设,配置相应的服务技术和管理。虽然,数字信息资源组织在通常情况下并不直接与用户联系,而是处于信息管理流程的中间位置,但是,坚持“用户至上”的观点,在信息组织过程中准确反映用户的需求,充分保障用户的利益是完全必要的。

数字信息资源组织工作应积极开展对用户的研究,调查用户的信息需求,据此设计数字信息资源组织体系的用户界面与服务功能。在信息资源组织与开发中,要充分了解用户需求,改进信息资源组织方式,运用先进的信息组织技术,使信息资源组织成果方便用户的选择和利用,尤其要注意将被动的信息资源检索变为主动的信息资源推送和知识导航,在信息资源与服务的整合开发和个性化服务方面下功夫,提供方便用户的功能,以优质的服务吸引用户(3)

②系统性原则。在对数字信息资源进行组织的过程中,坚持系统的观点和方法十分重要,没有系统性的数字信息资源组织工作是不可能实现其整体目标的。加强数字信息资源组织工作的协调管理,实现数字信息组织的整体效果,应该处理好几种关系:一是数字信息资源的宏观信息组织与微观信息组织之间的关系;二是数字信息组织中各个环节之间的关系;三是不同数字信息资源处理方法之间的关系。如前所述,数字信息资源的内容纷繁复杂,形态多种多样,其组织工作相对来说要复杂一些,因此,在信息组织中贯彻系统性原则就能够平衡好各种关系,获得最佳的整体功能。(4)

客观性原则。如实地将数字信息资源的外在特征和内容特征进行描述和揭示,并有序地形成相应的数字信息资源组织的成果,是数字信息资源检索和利用的需要。坚持客观性原则是指对数字信息资源描述和揭示的数据来源必须是客观存在的数字信息本身,使用诸如题名、相关作者的姓名、版本、出版日期、范围、识别相关特征的注释等来描述数字信息资源;坚持客观性原则是指对数字信息资源组织要完整地、全面地、精确地反映其客观特征,避免对数字信息资源的歪曲和肢解;坚持客观性原则还要不断地跟踪信息源的发展变化,适应信息组织技术和方法的更新,尤其是数据格式的标准化、描述语言的标准化和标引语言的标准化等,使数字信息资源组织与现代信息组织技术和方法保持一致。只有这样,才能实现不同系统间的数据交换,才能实现用户和系统以及系统与系统之间的有效沟通。

易用性原则。数字信息资源组织的最终目的是为用户有效利用,在其组织过程中,一方面要考虑普通用户的信息检索特点,尽量简单易用;另一方面也要考虑研究型、专业型用户的信息需求,应提供一些较为复杂的功能。这就要求检索界面的设计做到:第一,信息显示清晰明了,包括控制功能与操作方法的展现,结构与状态信息的显示,提示与帮助信息的显示等;第二,用户操作简单方便,包括命令的输入,数据的输入,画面的切换,功能的执行等都要便捷;第三,传递信息及时确切,界面能及时地将运行的状态,执行的结构显示给用户;第四,减少用户智力负担,在操作过程中,要求用户做出的判断或要求用户记忆的东西应该尽量地少,利用界面自动与智能功能让用户感到轻松。使用方便是任何类型的信息资源组织系统中都必须遵循的一条通则,数字信息资源组织亦不例外。

完备性原则。现代技术条件下,数字信息资源组织已经超越了信息媒体的限制,它可以利用高新技术,依托国家信息基础设施,建立数字信息资源组织网络体系,构建整合各种载体、各种类型的数字信息资源,如全文文本信息、图像、声音、视频信息等,使之成为一个完整的有机整体,对于特定数字信息对象范围的收藏是完备的。这是完备性原则的第一层含义。另一层含义是,数字信息资源组织包括对传统图书馆信息资源的数字化处理,使之在存取层面构成一个整体。为了支持用户对多种异构和动态的数字信息资源的有效利用,需要建立面向开放和分布数字信息环境的集成协调机制及相应的服务系统,如个性化集成定制系统、开放整合检索系统、开放元数据转换系统、开放链接服务系统、开放用户使用控制系统等,以便用户能够灵活地无缝地集成所需的信息资源。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈