首页 理论教育 数字信息资源建设

数字信息资源建设

时间:2022-03-10 理论教育 版权反馈
【摘要】:要从国家层面整合信息资源,建立数字信息资源建设的宏观调控机构,协调、安排全国各单位的数字信息资源建设,以避免各自项目投资、建设的重复和浪费,推动资源的全面共享。数字资源建设标准包括文献分类标准、数据描述标准、数据压缩标准等。

1.2 数字信息资源建设

1.2.1 数字信息资源建设的含义

数字信息资源是一个国家的数字资产,也是国家和社会重要的战略资源。和其他自然物质资源一样,数字信息资源也是一种能给社会带来巨大财富的资源,但与自然物质资源相比,数字信息资源又有自身的特殊性。

首先,自然物质资源一般是客观存在的资源,而数字信息资源则是经过人类开发与组织的信息的集合,没有人类的参与,就不会有数字信息资源的形成。数字信息资源的数量、质量、分布的状况,都是人们主观努力的结果,并且明显地受到社会科技经济政治文化诸因素的影响。因此,人们可以通过选择、组织、开发、布局等手段,对数字信息资源进行建设和优化,从而使数字信息资源给人类社会创造更多的财富。

其次,自然资源的丰富程度可用储备量来表示,而数字信息资源却是无法用储备量来衡量的。由于数字信息载体的非物质性、不稳定性、分散性和无序性,以及资源开发的动态性等,数字信息资源实际上是不存在储备量问题的。尽管人们常用GB、TB来描述数字信息的量,但如果没有经过科学的组织,不能实施有效的管理,再庞大的数字信息也不可能成为可供利用的资源。因此,数字信息资源建设实际上是一个不断开发数字信息,使之成为可用资源的过程。

再次,自然资源多为一次效用的物质资源,在使用中不是被消耗掉就是转变了存在方式,所以自然资源是越用越少的;而数字信息资源则具有广泛的共享性,可以供无数人同时或先后重复使用。它的奇特之处还在于它不会出现枯竭和产生什么危机。因为,信息是无处不在、取之不尽的,只要不断投入力量进行开发、建设,信息就会源源不断地成为数字化的资源,而且这种数字化的资源还会在使用中不断丰富,不断产生新的信息资源。

数字信息资源的这些特殊性告诉我们,数字信息资源是可以而且必须通过自觉的开发和建设使之形成和优化的。所谓数字信息资源建设,就是运用数字化的技术手段,将文字、图像、声音、动画等多种形式的信息,进行数字化的处理和加工,同时对已经形成的数字信息资源进行科学的规划、选择、采集、组织,使之形成可资利用的数字信息资源体系的全过程。这个定义的内涵包括以下几个方面:

第一,数字信息资源建设首先是数字信息资源的生产与开发,既包括运用数字技术手段,直接生产数字化的文字、图像、声音、动画等信息,也包括对各种非数字化的信息进行数字化的处理、加工,形成数字化的信息资源。

第二,数字信息资源建设还要对已经生产出来的数字信息进行科学的规划、选择、采集和组织。规划就是从宏观、微观的角度制定数字信息资源发展的长期、中期、近期战略规划,建立不同层次的数字信息资源共建共享体系,以及数字信息资源政策和法律框架。选择就是要从数量极其庞大、分布广泛分散、内容繁杂混乱、质量良莠不齐的信息源中,经过鉴别、评价,挑选出符合特定需要的、有价值的信息。采集就是以人工的或自动化的方式和手段,通过各种途径去搜索、获取各种形式的数字信息。组织就是对采集的数字信息资源进行加工、整序,揭示其内容和形式特征,组成各种信息检索工具和检索系统,并且以感知、思维、创造等方式,深入信息内容,去发现、发掘、提取有现实或潜在价值的信息,以供人们有效利用。对数字信息资源的规划、选择、采集、组织,构成了数字信息资源建设的全过程,每个环节都有特定的功能,同时又相互联系,相辅相成。

第三,数字信息资源建设的目的是形成可资利用的数字信息资源体系。信息资源是一种附加了人类劳动的信息。凡是未被组织和开发从而能够为人们所利用的信息都不属于信息资源。因此,可利用性是数字信息资源的重要特征。所谓可资利用,应该包括这样一些标准:①资源丰富,没有一定的丰裕度,数字资源就很难得到利用;②选择精良,即通过鉴别、选择,排除了那些繁芜、杂乱、可信度低、严重污染的信息,使提供利用的数字信息达到较高的精度;③查询简便,即检索工具和检索系统易学易用,使用方便快捷;④传递迅速,即使用者在需要的时候能够及时迅速地获得有关信息资源。这种可资利用的数字信息资源,应该是一个有序的信息资源体系。从微观上看,它要根据特定的目的,将不同内容、不同层次、不同载体、不同时间、不同语种的数字信息资源组成一个相互联系、相互依存的系统,以满足特定服务对象的信息需求。从宏观上看,要对一定范围(地区、系统或全国)的数字信息资源进行统筹规划、合理配置、科学布局,从而满足整个社会的信息需求。

1.2.2 数字信息资源建设的内容

数字信息资源建设是围绕数字信息资源体系的形成、发展而进行的全部活动,其主要内容可概括如下:

(1)数字信息资源建设规划

数字信息资源建设是一项庞大的社会系统工程,它的影响因素众多,联系复杂,因此,必须从不同层次对数字信息资源建设进行规划。

从宏观层次上看,国家应该从资源整合的角度进行统一规划,分工协作,联合进行数据库建设。数字信息资源建设不可能仅仅依靠几个图书馆和情报信息服务单位,而是必须依靠社会上所有信息资源拥有者的大力合作,形成数字信息资源建设群体。各单位、各部门在根据整个社会信息资源共建共享的计划,对本单位的优势进行有针对性的数字化信息资源建设的同时,还应该将元数据提供给数字图书馆中心及分中心。要从国家层面整合信息资源,建立数字信息资源建设的宏观调控机构,协调、安排全国各单位的数字信息资源建设,以避免各自项目投资、建设的重复和浪费,推动资源的全面共享。要统一标准规范,避免出现各自为政、互不兼容的现象。数字资源建设标准包括文献分类标准、数据描述标准、数据压缩标准等。其中文献分类标准有DDC、UDC、LCC、IPC、《中国图书馆分类法》、《中国科学院图书馆图书分类法》、《中国人民大学图书馆图书分类法》等,数据描述标准包括文献著录标准、MARC标准、置标语言标准、元数据标准等,数据压缩标准包括JBIG、JPEG、MPEG、P64等。国家应该从如此多的标准中选择适合我国国情的标准作为数字信息资源建设的统一标准(13)

从微观层次上看,每一个具体的图书馆或其他信息机构要根据本单位的性质、任务和用户的需要,确定本单位数字信息资源建设的原则、资源开发或收集的范围、重点和采集标准,提出本单位数字信息资源构成的基本模式。在此基础上,制定数字信息资源建设计划,同时协调好数字信息资源与其他类型的信息资源的关系,安排各类型信息资源的数量、比例、层次级别,形成有内在联系和特定功能的信息资源结构,建立有重点、有特色的专门化的信息资源体系。

(2)数据库建设

各种形式的信息资源只有经过数字化处理和加工,并加以科学的组织,才能在网络环境下实现广泛的资源共享。网络环境下信息资源的组织方式多种多样,如文件方式、主题树方式、超媒体方式、索引擎方式、数据库方式等。应该说,数据库是其中最重要和最为有效的信息资源组织方式。因为数据库是对大量的规范化数据进行组织和管理,使其数字化,并且可一次输入多次输出,实现多途径的组合检索利用,大大提高信息组织管理的效率。全文数据库技术的发展,可更深层次地揭示信息的内容。另外,在网络环境下,因为数据库的最小存取单位是字段,所以可根据用户需求灵活地改变查询结果集的大小,从而大大降低了网络数据传输的负载(14)。因此,数据库建设是信息资源组织的最重要、最有效的方式,因而也是数字信息资源建设的核心内容。

数据库建设的内容主要包括:

①数据库选题。数据库选题是指在数据库建设之前,针对数据库建设的可行性问题所开展的调研。调研内容包括:国内外已有的或在建的数据库信息资源分布状况;分析和研究特定读者群,以掌握用户对该数据库的现实需求和潜在需求;分析拟建设的数据库的学术价值、利用价值、经济效益和社会效益等;调查信息源的充足性以及信息搜集渠道的畅通性;调查数据库建设所需要的软硬件环境、技术人才、资金等。

②数据收集。数据收集主要是对各种形式的信息资源进行汇总筛选、整理集中。要注意确定数据库所包含信息资源合理的收集范围、信息资源的种类、信息资源的形式。同时根据加工能力,制定工作计划。应建立并拓展畅通的信息源采集渠道,及时采集新的信息资源,随时对信息资源进行查漏补缺,以保证信息资源的完整性、权威性、即时性。

③数据加工。数据加工是对所收集的数据进行处理和加工,主要包括:

a.筛选:认真审核并筛选所收集的数据,删除那些重复的、不准确的以及价值不大的信息,确定可以收录进数据库的数据;

b.数字化处理:以纸介质载体为信息源主体的数据库建设,需要对大量纸质文献进行图像扫描、图像处理、转换识别、编改、校对等;

c.标引:选择合适的标引方式,制定标引细则,详细规定标引的深度、分类的集中与分散、主题词和关键词的选用规则等;

d.录入:制定严格的质量管理制度,确保输入的数据准确无误;

e.审核:全面、认真地进行审校,确保录入的每一条记录的准确性;

f.数据发布:使用数据库管理软件,将内容以便于用户浏览、检索的网页形式发布;

g.更新维护:收集用户在使用数据过程中反馈的信息,及时对数据进行替换、删除、修改和整理。

(3)网络信息资源的开发和组织

随着因特网的普及和发展,网上信息资源迅速增长,并且内容丰富,形式多样,分布广泛,信息的传递完全突破了时间和空间的局限,为人们获取信息带来了极大的便利,因而网络信息资源成为目前最重要的一种信息资源类型。然而,网络信息资源也有致命的弊端,即网上信息资源的庞杂无序性与用户信息资源需求结构之间的矛盾越来越突出,人们从网上浩如烟海的信息中获取自己所需要的信息变得越来越困难。因此,如何对网络信息资源进行开发,将无序的网上信息组织成有序的信息资源系统,以提高用户使用网上信息资源的效率,满足人们的信息需求,成为人们日益关注的问题。

搜索引擎是人们较早开发出的因特网信息检索工具。它根据TCP/IP协议在网上漫游,发现新的网址、网页信息,然后对有用的信息进行抽取、排序、归并后建立网络索引数据库。网络索引数据库按一定方式、结构存储,并提供特定处理系统需要的相关信息,如网址、一些相关性描述的信息和一些可被计算机识别的字段字符等。这种方式的自动化程度高,更新速度快,并可提供位置检索、概念检索、截词检索、嵌套检索等多种检索方式,但用户查检到的信息内容过于庞杂,需要的与不需要的信息都堆积在一起,需用很多的时间来加以识别和筛选,查准率较低(15)。搜索引擎的另一大缺陷是它所搜索出来的信息多为大众化的信息而不是专业性较强的学术信息,而目前在因特网上的学术信息资源在迅速增长,日益成为科研工作中不可忽视的重要信息源。为了科学、有效地利用网络学术信息资源,必须对网上的学术信息资源进行整理和序化。

网上学术信息资源导航是网络学术信息资源建设的重要方式。导航是利用已有的信息标引、分类、查询、搜索、评估等方面的理论与实践,精选因特网上海量的学术信息资源,并将经过注释或评注的网站组织到特定的界面,从而为用户提供免费信息服务的过程(16)。对于网络环境下的图书馆或其他信息服务机构而言,导航已经成为其必不可少的一项业务工作,而从宏观来看,导航则是对整个网络信息资源的序化。网络学术资源导航具有站点导航和搜索引擎的双重功能,可以实现对站点的整理、指引和检索,它可以针对特定的专业领域,根据对知识内容及其关系的分析,把专业领域所需要的各种资源和服务整合到一个知识体系中,从而为教学、科研用户提供便捷的信息服务。

(4)商业化电子资源的购买

在论及数字信息资源建设时,人们往往首先想到的是数据库建设、网络信息资源的开发,其实对大多数图书馆或其他信息机构而言,直接向市场购买商业化电子资源,也是数字信息资源建设的重要内容。所谓商业化电子资源,主要是指由出版商或电子资源提供商生产发行的、商业化的正式出版物,包括商业数据库、电子期刊、电子图书以及其他电子资源。近年来,国内外许多数据库生产商或数据库服务提供商开发的各种文献数据库已囊括了大部分的学科和主要的文献类型,而且质量很好。对于已经商品化的数据库,图书馆或其他信息机构无须自己另行开发,购买或租用比自己建设成本要低得多。根据一定的采选原则和标准,通过与电子资源提供商签订使用合同,付费购买其使用权,通过本机构的界面供内部用户或远程用户使用,这是目前图书馆或其他信息机构数字信息资源建设的重要方式。

(5)数字信息资源的整合

数字信息资源整合是数字资源优化组合的一种存在状态,是依据一定的需要,对各个相对独立的数字资源系统中的数据对象、功能结构及其互动关系进行融合、类聚和重组,重新结合为一个新的有机整体,形成一个效能更好、效率更高的新的数字资源体系(17)。整合就是综合运用各种技术、方法和手段对图书馆所拥有的众多数字资源进行系统化和优化,将所有的数字资源透明地、无缝地集成在一起,用户在统一的检索界面中检索、浏览和使用所有数字化资源。资源整合实现了不同文献资源之间的沟通,保持了知识体系的完整性,数字资源的整合程度直接关系到它能否被高效吸收与利用。

数字信息资源整合之所以成为数字信息资源建设的重要内容,是基于以下原因:从数字资源本身来看,其内容交叉重复,存在着大量的冗余信息,而且知识关联程度较低,影响用户的利用与获取;从对数字资源利用的角度来看,由于不同的数字资源系统之间数据结构不同、发布方式不同、检索方式也不同,用户检索利用数字资源需要在不同系统间来回切换,需要掌握不同的检索方法,这显然十分不便。因此,用户希望通过统一的检索界面和统一的检索语言,方便快捷地检索到图书馆或其他信息机构的所有分布式资源(书目、图像、音频、视频、档案资源、电子图书、电子期刊和会议录等),同时检索本地和异地各种资源系统,希望图书馆或其他信息机构提供一站式服务。因而,如果不对数字资源进行合理有效的整合,则会影响数字资源的有效利用。而整合实质上就是利用知识组织原理和技术,对不同渠道、不同类型、不同学科、不同形式的知识,按一定的逻辑关系进行分解、重组,组织成立体网状、相互联系的知识体系。很显然,这正是数字信息资源建设题中应有之义。

1.2.3数字信息资源建设的意义

(1)数字信息资源建设促使数字资源源源不断地产生,从而大大丰富了我国经济和社会发展的资源基础

随着信息社会的到来,信息资源已经成为国民经济和社会发展所必需的一种重要的战略资源,它为我们提供的是非物质形态的社会财富。改革开放以来,我国的国民经济以惊人的速度发展,但这种快速发展是以能源和原材料的大量消耗和生态环境的恶化为代价的,因而是难以持续的。2003年党的十六届三中全会明确提出“科学发展观”这一新的发展理念,党的十七大更进一步提出要深入贯彻落实科学发展观,创新发展理念,转变发展方式,破解发展难题,提高发展质量和效益,实现又好又快的发展。科学发展观的要义之一,就是转变经济增长的资源基础,将主要建立在能源、原材料等自然物质资源基础上的经济发展模式,转变到主要依靠科技进步和以信息、知识为资源基础的发展模式上来。因此,对信息资源的建设、开发和利用,是科学发展的题中应有之义。加强信息资源建设,对促进我国经济和社会的全面、协调和可持续发展具有特殊重要的意义。

在新的信息环境中,数字信息资源已经成为信息资源的主体。“全球数字化资源正在快速增长。据加州大学专家调查,全球新产出的信息量每3年翻一番,大约90%的信息以数码形式储存在某种计算机装置里。1998年SCI中只有30%的被引期刊是在线版,2002年则增加到75%。Frank Romano预测到2015年48%的书会以数字储存随选打印方式存在。”“2006年Google可搜索80多亿网页、超过10亿张图片。”(18)因此,加强我国数字信息资源建设,促使数字资源源源不断地产生,符合国际上信息化发展的大趋势,也为我国经济和社会发展提供丰富的资源基础。

(2)数字信息资源建设促使数字信息资源组织科学化,使无序的信息成为可以利用的重要资源

随着人类知识的急剧增长和科学技术的迅速发展,数字信息源源不断地涌现,形成强大的“信息流”。数字信息的产生从整体上看是处于无序、随机、散乱,甚至失控状态的,人们很难有效地加以利用,因而这样的数字信息还不是真正意义上的资源。为了有效控制数字信息流的动向,充分利用信息资源,就需要对信息流加以整序。数字信息资源建设的任务之一,就是对无序的数字信息流加以整序,组织成一个科学有序的体系。从微观上看,数字信息资源建设要对数字信息进行鉴别、筛选、采集、加工、组织、管理,实现数字信息资源建设过程的最佳化。从宏观上看,数字信息资源建设的内容是对数字信息资源的生产进行统筹规划、科学调整和控制,对数字信息资源进行合理布局和配置,加强数字信息资源建设的规范化和标准化,建立全国和地区的信息资源保障体系,使数字信息真正成为一种可以利用的资源,从而为社会创造巨大的财富。

(3)数字信息资源建设促进信息资源的深层次开发和远距离获取,为人们利用数字信息带来极大的便利

现代信息技术的支持下,信息资源建设中对信息的加工与处理从对信息形式特征的描述深化到对信息内容的揭示。信息资源建设构筑了庞大的数据库体系,信息不仅以文字、数值的形式出现,而且还开发出图像、声音、动画以及多媒体等形式。信息在内容上以书目、指南、词典以及全文等类型存储于数据库之中,而且巨大的存储能力和多入口多途径的检索能力使大量无序的信息以有序可检的方式存在。信息资源建设在完善的通讯条件下使人们可以跨越空间获取所需信息,在自己家里就可以浏览图书馆的最新书刊,查阅世界各国的文献资源与数据。这些都为人们利用信息带来了极大的便利。

(4)数字信息资源建设是网络环境下图书馆及其他信息机构赖以提供服务的重要的基础和保障

图书馆及其他信息机构是信息资源的主要集散地。在网络环境下,数字信息资源已经成为信息资源的主体,也是图书馆等信息机构开展信息服务最重要的资源基础。数字信息资源建设对数字信息资源进行科学的规划、选择、采集、组织,使之形成可资利用的数字信息资源体系,因而是当今图书馆及其他信息服务机构最主要的业务工作之一。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈