首页 理论教育 数字信息资源

数字信息资源

时间:2022-03-10 理论教育 版权反馈
【摘要】:笔者认为,数字信息资源应该是就信息资源的狭义而言的,是指各种以数字形式,即以能被计算机识别的、不同序列的“0”和“1”构成的形式,生产和传递的信息是与传统的文献型信息资源并列的一个概念。数字信息资源产生的最早形式是书目数据库。

1.1 数字信息资源

1.1.1 数字信息资源的概念

以计算机为核心的现代信息技术,将人类社会带入数字化时代。“数字信息资源”、“数字资源”作为一个专业术语,越来越频繁地出现在各种文献中,并被图书馆学、信息学界和业界广泛使用。

从语义逻辑来看,数字信息资源无疑属于信息资源的范畴,而关于信息资源的含义,目前仍有不同的解释,归纳起来主要有两种:一是狭义的理解,认为信息资源就是指信息本身,即各种媒介和形式的信息的集合,包括文字、声音、图片、视频、印刷品、电子信息、数据库等;二是广义的理解,认为信息资源是信息活动中形成信息产品的一切支撑性资源,除狭义的信息资源以外,也包括与产生信息有关的人员、设备、技术和资金等各种资源。笔者认为,数字信息资源应该是就信息资源的狭义而言的,是指各种以数字形式,即以能被计算机识别的、不同序列的“0”和“1”构成的形式,生产和传递的信息是与传统的文献型信息资源并列的一个概念。据此,我们可以将数字信息资源定义为:所有以电子数据的形式把文字、图像、声音、动画等多种形式的信息,存储在光、磁等非纸介质的载体中,并通过网络通信、计算机或终端等方式再现出来的资源。

随着互联网的发展,越来越多的数字信息资源通过网络来储存、传递和利用,人们将这类数字信息资源称为网络信息资源。目前,网络信息资源已经成为数字信息资源的主体,但也仍有大量仅在本地计算机上使用、没有通过网络传递的信息资源,如只用于单机的光盘或机读磁带数据库等,这一类资源也应归入数字信息资源。

1.1.2 数字信息资源的产生和发展

数字信息资源是伴随着电子计算机的诞生而出现的。1946年,世界上第一台大型电子计算机在美国问世。电子计算机的设计思想就是采用二进制的“0”和“1”来表示数据和指令,因此,数字化的信息是电子计算机的核心要素。正是电子计算机实现了信息的数字化,从而带来了信息载体和传输介质的革命性变化。随着现代信息技术的迅速发展,计算机技术与通信技术、网络技术、存储技术、多媒体技术结合,形成前所未有的网络环境,数字化的信息资源从无到有,从少到多,从单一媒体到多媒体,从本地使用到网上发布,成为今天社会生产、生活、学习和研究中不可缺少的重要信息源。

数字信息资源产生的最早形式是书目数据库。1954年,美国海军兵器中心研制出基于IBM701计算机的信息检索系统,计算机首次应用于批式检索。1961年美国化学文摘社(CAS)用计算机来编制《化学题录》,机读磁带由此而产生。1964年,美国国立医学图书馆创建了医学文献分析与检索系统MEDLARS(Medical Literature Analysis and Retrieved Systems),用户不仅可以进行多种逻辑运算,还可以从多种途径检索文献,这标志着数据库的问世。随后,美国其他一些机构也相继使用电子计算机编辑文摘期刊,从而形成了一批文献目录型数据库。有资料表明,至1965年,已有大约20个数据库可供使用,但这时的数据库存储介质仅限于机读磁带,内容以科技文献书目、索引、文摘为主,检索也是以脱机批处理的方式进行的,因此应用并不广泛(1)

20世纪60年代后期,电子计算机技术、信息存储技术、数字通信技术和分组交换网的发展,使信息的远距离传输和交换成为可能,从而也推动了国际联机检索系统的发展。国际联机检索就是用户使用终端设备,远距离从国际联机检索中心迅速而准确地获取数字化信息,其实质就是数据库和通信的结合。因此,国际联机检索促进了数据库的发展。从20世纪60~70年代起,许多国家先后建立了专门从事计算机检索的机构,一些著名的国际联机检索系统如DIALOG、ORBIT、ESA-IRS、BRS、JOIS、QUESTEL、MEDLINE等相继开始服务,数据库的数量开始成倍增长。到1975年,已有近300个数据库(2)。数据库产业也开始兴起,数据库生产由政府行为逐步转向商业行为,用户也由原先的以政府机构为主扩展到更多的图书馆和科研机构。数据库所涉及的专业面也越来越广,除自然科学以外,还包括人文社会科学和应用科学。另外还出现了与目录数据库类似的、存取数值型信息的数值数据库和记载事实全文的事实型数据库。

20世纪70年代以后,卫星通信技术、光纤通信技术、个人计算机的产生和发展极大地促进了数据库联机检索的发展。联机检索已不受地域限制,向国际化方向发展,个人用户开始加入数据库检索的行列。数据库的生产迅速发展,在短短十年内增长了10倍,到80年代末,数量已达到3600多个(3)。数据库的容量也大大增加。1975年,每个数据库记录数平均值为17.3万条;1985年达到55.8万条;1997年达到116.6万条;2001年达到153.4万条。从数据库的类型来看,最早的数据库主要是文字型的,文字型数据库在各种类型的数据库中占70%左右。20世纪60~70年代,文字型数据库中,书目型占主体地位;但到了80年代中期,全文数据库的比例扶摇直上,从1985年的28%增加到1997年的50%,而书目型则从57%下降到24%。目前,全文数据库的数量与书目数据库的比例已经达到2∶1(4)。从数据库的存储介质来看,虽然联机数据库仍占主导地位,但光盘数据库发展也很迅速。由于光盘数据库在存储数字信息方面具有存储密度高、读取速度快、容量大、体积小、寿命长、可实现随机存取和检索费用低廉等优点,所以,光盘被广泛用于存储、检索数字信息资源,并产生了一批生产系列光盘的公司,如美国的UMI公司和银盘公司等,同时也产生了光盘数据库检索系统。数据库生产国则由过去的以美国为主体向欧洲、日本等发达国家扩展。目前数据库产业已经发展成为一项国际性产业,数据库生产投资的国际化、数据库内容的国际化以及数据库生产与联机服务的跨国经营越来越普遍。

进入20世纪90年代,Internet的迅猛发展使得基于网络开发的数字信息资源及其检索系统有了突飞猛进的发展。Internet是通过互联而形成的全球性网络,它的所有主机都采用TCP/IP协议连接和通信,网上各种计算机都遵循该协议所规定的方式进行数据交换,这就使Internet存储了极为丰富的数字信息资源,这些资源主要包括电子图书、电子报刊、电子新闻、电子论坛、会议资料、各种软件资料、图像文件、声音文件和电子游戏等。

近年来,越来越多的正式出版物通过Internet传播并提供使用,Internet的学术信息资源迅速发展,成为生产、科研和教学重要的信息源。如电子期刊,这些期刊出版周期短,可以检索和重复下载全文,图像与文本相结合,包含多媒体及其他类型的动态信息,具备超链接功能等优势,它已经在很大程度上取代了印刷型期刊而成为重要的学术信息源。电子图书尽管有版权问题的困扰,但仍以不可遏止的速度发展壮大。又如电子报纸,其新闻是动态的、多媒体的,更新及时,并通过超文本链接技术组织大量专题报道,因而吸引了越来越多的用户。除此以外,还有其他非正式出版信息,如政府信息、电子公告板、搜索引擎、新闻组、FTP站点等,更是以惊人的速度发展。由于Internet中的WWW网络信息系统采用链式节点链接,用户检索起来十分方便,检索范围也大大拓宽,可检索的信息除了文本信息外,还有声音、图像等多媒体信息资源。同时,Internet的信息更新速度快,用户得到的信息时效性强,而且网上的资源大部分可以免费获得或费用比较低廉。正是由于这种种优势,网络信息资源不仅成为数字信息资源的主体,而且在整个信息资源体系中,它也开始占据主导地位。

1.1.3 数字信息资源的类型

数字信息资源的类型是随着信息技术的迅速发展而日益丰富的。不同类型的数字信息资源的特点、功能存在一定差异,因此,科学划分数字信息资源的类型,有利于对数字信息资源进行开发、管理和利用。

数字信息资源的范围非常广泛,形式多种多样,依据不同的标准,可以划分为不同的类型:

(1)按数字信息资源内容的表现形式划分,有数据库、电子期刊、电子图书、电子报纸等

数据库是以一定的组织方式存储在一起的相关数据的集合,是数字信息资源最早的形式,也是数字信息资源的主要构成部分,包括书目数据库、数值数据库、事实数据库、全文数据库等类型。

电子期刊就其广义而言,是指所有以电子形式存在的期刊,包括印刷型期刊的电子版、无印刷版的网络型电子期刊、光盘型的电子期刊。严格意义上的电子期刊是纯电子期刊,即从投稿、编辑出版、发行订购到阅读的全过程都是在网络环境中进行的,任何阶段都不需要用纸,因而与传统的印刷型期刊有着本质的区别。

电子图书是指直接以数字形式出版的图书或纸质型图书的数字化形式以及以电子版的方式(其载体为软盘、光盘或网络)呈现的,并通过电脑或电子图书阅读器进行阅读的一种电子文献(5)。电子图书按照传统书籍的格式编排以适应读者的阅读习惯,但它所具有的图文声像结合、可检索、可复制、低成本等优点,是传统书籍所不具备的。

电子报纸是指综合运用多媒体技术、网络技术和通信技术,完成出版、发行、利用全过程的新闻媒体。电子报纸的内容可以是文字、表格、彩色图形、图像,甚至是声音、动画等的多媒体信息,读者可以在任何地点利用计算机网络进行信息检索、存储和利用。从载体形式来看,电子报纸有3种类型:一是网络版电子报纸;二是以光盘或硬盘等载体存储和发行的报纸,如《人民日报》光盘数据库和便携式电子报纸;三是一种全新的电子报纸,它融合了报纸、计算机和网络的特点,表面上看同普通报纸没有两样,但它有一个微电脑在报纸的夹板内(6)

(2)按存储信息的介质划分,可分为磁介质和光介质两种类型

磁介质包括磁盘、磁带、磁盘阵列、硬盘、活动硬盘等。在数字化初始阶段,磁盘是数字化信息最原始、最主要的载体。早在20世纪60年代初,美国化学文摘服务社在出版印刷版的《化学文摘》时,就出版了磁带版的《化学文摘》,实际上就是最早的数字化信息。随着信息存储技术的发展,超大容量的外存储系统磁盘阵列以及可移动磁盘相继问世,成为重要的数字信息载体。

光介质是一种用激光来记录和再现信息的高密度存储介质,即光盘。光盘可分成两类,一类是只读型光盘,其中包括CD-Audio、CD-Video、CD-ROM、DVD-Audio、DVD-Video、DVD-ROM等;另一类是可记录型光盘,它包括CD-R、CD-RW、DVD-R、DVD+R、DVD+RW等。1966年,用光盘存储信息的概念首次被推出。1985年世界上第一个商品化的CD-ROM数据库——BiblioFile(美国国会图书馆的MARC,即机读目录)推出。光盘技术迅速发展,凭借其容量大、体积小、重量轻、价格低并可同时存储声音、图像、文字,且携带方便等优势,使信息处理、传播、检索和利用的模式都发生了革命性的变化。

(3)按数据传播的范围划分,可分为网络信息资源和单机信息资源

网络信息资源是指借助于计算机网络可以获取和利用的数字信息资源的总和。从数字资源建设的角度出发,网络信息资源不是一个物理概念,也不是独立存在的实体,而是一个跨国家、跨地区的信息空间,一个网络信息资源库。网络信息资源还可依照不同的标准划分成不同的类型。如按使用形式划分,可分为联机检索信息资源和因特网信息资源两种类型;按所对应的非网络信息资源可分为联机公共目录、电子书刊、参考工具书、数据库等;按信息存取方式,可分为邮件型、电话型、揭示板型、广播型、图书馆型、书目型,等等。

与传统非数字化信息资源相比,数字化信息资源的类型相对来说更加丰富。

单机信息资源是指通过计算机存储和阅读但不在网络上传输的数字化信息资源。它与网络信息资源的区别就在于其存储和传播的空间范围。随着计算机存储设备容量的不断扩大以及计算机网络技术的不断发展,计算机间的透明访问越来越多,这两类信息资源的差别也越来越小。对单机信息资源也可以做进一步的划分,常见的有本地文件系统、本地光盘系统、本地数据库等(7)

(4)按数字信息资源的生产途径和发布范围划分,可分为商用电子资源、网络公开学术资源、特色资源(8)

商用电子资源,亦称正式电子出版物,由正式出版机构或出版商/数据库商出版发行,在数字学术信息资源中所占比例最大,包括各类数据库、电子期刊和电子图书。其特点是:学术信息含量高,具备检索系统,便于检索利用,出版成本高,必须购买使用权才可以使用,因此并不是面向社会公众免费开放的。

网络公开学术资源,也可以说是半公开出版物,完全面向公众开放使用,包括各种学术团体、行业协会、政府机构、商业部门、教育机构等在网上正式发布的网页及其信息,用于使用图书馆印刷型馆藏的联机公共目录(OPAC)也属于这部分范畴。

特色资源也属于半正式出版物,主要基于各教育机构、政府机关、图书馆的一些特色收藏制作,在一定范围内分不同层次发行,不完全面向公众发行,有时需要特别申请。例如教师的教学课件(CAI),只在校园网内作为教学资料使用。

(5)按数字信息资源的生产方式划分,可分为原生数字信息资源和复合数字信息资源

原生数字信息资源是通过科研人员有意识的思维活动,把客观存在的离散的原生态信息源经过一定的积累、分析、比较、判断、归纳和重组,经过数字化处理,创造出的符合客观实际的、知识化的数字信息资源。由于原生数字信息资源包括已公开发表的一次文献资源和未公开发表的灰色文献资源,则原生数字信息资源具有原始性和原创性等特征(9)

复合数字信息资源多数是从其他载体(如纸介质)文献转化而来的数字信息资源。这在当前及今后一个时期,仍然是我国图书馆馆藏数字资源建设的主要形式之一,但随着社会信息化程度的提高,原生数字信息资源的增长速度在加快。

(6)按数字信息资源的性质和功能划分,可分为一次数字信息资源、二次数字信息资源、三次数字信息资源

一次数字信息资源,指反映最原始思想、成果、过程以及对其进行分析、综合、总结的信息资源,如电子图书、电子期刊、电子报纸、事实数据库、发布原始信息的学术网站等。用户可从一次数字信息资源中直接获取自己所需要的原始信息。

二次数字信息资源,指对原始信息进行加工、整理,便于利用原始文献的信息资源,如参考数据库、网络资源学科导航、搜索引擎/分类指南等。二次数字信息资源是检索一次数字信息资源的有效工具。

三次数字信息资源,指对二次信息资源进行综合分析、加工、整理的信息资源,如专门用于检索搜索引擎的搜索工具,比较典型的是WebCrawler,被称为“搜索引擎之搜索引擎”,即“元搜索引擎”,当用户进行检索时,反映出来的结果是各搜索引擎的检索结果(10)

除上述分类外,还可以按其他的标准划分出不同的类型,服务于某一特殊的数字信息资源管理的需要。

1.1.4 数字信息资源的特点

数字信息资源在生产制作方式、信息符号、载体材料、载体形态等方面与传统的纸质文献完全不同,因此它也具有与传统纸质文献完全不同的特点:

(1)高度的共享性

数字信息资源是以现代信息技术为生产手段而形成的一种数字化的信息,其共享性主要体现在两个方面:第一,数字信息可以进行大量的无差别复制,其复制品不仅不存在任何质量和功能上的缺陷,而且复制的成本极为低廉,并且对信息源没有任何损害,因此,数字资源从本质上就是一种易于共享的资源。第二,数字化的信息以机读数据的形式存在,既可以在计算机内被高速处理,又可以通过通信网络进行远距离传送,不受时间和空间的限制,这就使数字信息资源在全球的共享成为可能。

(2)类型的多样性

数字信息资源包含的信息类型多种多样,从电子报刊、电子工具书、商业信息、新闻报道、书目数据库、文献信息索引,到统计数据、图表、电子地图等,既可以是文字、图表等静态信息,也可以是集图、文、声、像于一体的动态多媒体信息,并且各种类型的数据又可借助计算机实现任意的组合编辑,具有打印输出及磁盘输出等多种输出方式。这就使得信息的组织方式发生了巨大的变化,不仅以知识和信息为基本单元,而且充分展示这些单元间的逻辑关系(11)

(3)检索的便利性

数字信息资源以磁性材料或光学材料为存储介质,以二进制数字代码为信息符号,通过将文字、图像、声音等变成磁性介质上的电磁信号或光介质上的光信息来进行信息的储存和传递。因此,数字信息具有超强的检索功能,检索信息的速度快,检索途径多,检索信息不受时间地点的限制。特别是网络信息资源检索利用超文本链接,构成立体网状文献链,能把不同国家、不同地区,各种服务器、各种网页、各种不同文献都通过节点链接起来,使人们能够在浩瀚的信息海洋中快捷、准确地得到所需的有关信息。

(4)信息的时效性

由于数字信息从根本上改变了信息的创造、交流和获取的方式,也颠覆了传统的出版概念,无纸化的出版从作者投稿、专家审稿到稿件编辑等都在网上进行,大大缩短了文献的编辑出版时间,从而使信息的时效性大大增强。而且,数字信息资源的更新也比传统出版物的修订容易得多。只要有人负责不断跟踪各个领域的最新发展变化,就可以随时修改内容,每月、每周、每日甚至每时更新,及时将信息发布给用户。

(5)信息的不安全性

数字信息从形成、传输到存储都是通过计算机或具有类似功能的设备实现的,所以数字信息对计算机系统各种软硬件设备具有很强的依赖性。离开了计算机的软硬件平台,离开了产生信息的原有的计算机操作系统、数据格式等技术环境或网络环境,将无法读出或还原原有的数字信息(12),因此,数字信息的长期保存面临着严峻的挑战。在网络环境下,数字信息安全还受到计算机病毒、黑客攻击等威胁。数字信息的易复制性,也给数字信息的知识产权保护带来诸多问题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈