首页 理论教育 计算机技术在图书馆中的应用

计算机技术在图书馆中的应用

时间:2022-03-10 理论教育 版权反馈
【摘要】:计算机技术的进步、带动了图书馆自动化、联机信息检索、数据库开发与服务、电子出版物、数字文献传递、网络信息资源服务等诸多与现代图书馆关系极为密切的领域的发展。特别是下列几项技术将会在图书馆中被越来越广泛地应用。从上述说明和Saffady的数字计算与对比来看,现代图书馆利用海量存贮技术,尤其是磁盘组等自动存取装置,组织大型的电子信息数据库,存贮数字化馆藏是完全可能的。

第三节 计算机技术在图书馆中的应用

当前,在我国的图书馆的现代化建设中,不管是功能日益拓展的自动化管理,还是代表21世纪现代化图书馆的技术和发展方向的数字图书馆,它们从构想、试验、初步实践、直到实现的每个阶段都是计算机技术群综合应用的结果。计算机技术的进步、带动了图书馆自动化、联机信息检索、数据库开发与服务、电子出版物、数字文献传递、网络信息资源服务等诸多与现代图书馆关系极为密切的领域的发展。我国的图书馆虽然在这方面起步较晚,但从上世纪末到本世纪头五年的发展态势来看,其速度大大超过我们的想象。特别是下列几项技术将会在图书馆中被越来越广泛地应用。

一、数字化技术

这种技术利用计算机把文字、数值、单色和彩色图形、静止和活动图像、声音等多种形式的信息输入计算机系统并转换成二进制数字(由“0”和“1”两个数字组成)编码,以对它们进行组织、加工、存储、采用数字传输技术加以传送,并在需要时把这些数字化的信息再还原成文字、数值、图形、图像和声音。数字化技术的发展使信息的表达和传递产生了质的飞跃,引发了如美国麻省理工学院教授尼葛洛庞帝(Nicholas Negroponte)所称的“数字革命”。从联机检索、CD-ROM、多媒体到Internet及信息高速公路,这些技术得以实现的基石都是信息的数字化。现代图书馆中数字技术占有非常重要的地位,传统书刊、视听资料等的转换都依靠数字化技术来实现。美国微软公司总裁比尔·盖茨曾经对数字化技术影响下的未来图书馆进行了描述,他在其著作《未来之路》中写道“未来的信息和当前最根本的差别就是几乎所有的信息都将是数字化的,图书馆中全部的印刷品都已经被扫描并且以电子数据的形式存储在磁盘或光盘上;图片、电影、录像等都被转换成数字化信息。一旦数字化信息被储存起来,拥有个人计算机和获取信息渠道的任何人都可以随时调用、读取、比较、复制这些信息。计算机所提供的低成本、高速度处理传输数字信息的能力将改变家庭和办公室的传统通信设备。”我们认为,盖茨所描述的未来图书馆无疑是数字图书馆,而且是传统印刷型馆藏最大限度地实现了数字化转换、存储、处理、传输的数字图书馆。

二、信息存贮技术

现代图书馆中的信息媒体不仅包括传统意义上的书刊等,还包括其它信息载体,如照片、地图、图片、磁带、磁盘、录像带、录音带等。这些信息媒体经数字化后信息量非常之大(如以600dpi分辩率扫描产生的一幅彩色图像通常是几兆大小的文件,即使用JPEG算法压缩后的文件还相当大),需要大容量的存贮装置。因此,信息存贮技术对现代图书馆的容量信息存贮来说就至为关键。随着信息技术的进步,磁盘、磁带和光盘等主要存贮载体的存贮量都有了很大提高。在西方国家,市售大型机用磁盘机的单轴容量已达数万兆字节。如美国已出售单轴容量为33GB的磁盘机和单机容量为1200GB的盒式磁盘海量存贮设备。微机用以GB为单位的高容硬盘正以年均增长29%的高速度发展。以TB(1000GB)为单位的磁盘已进入市场,这些发展使微机的贮存能力大大提高。

现代图书馆中的全文文本、图像、声音等信息可以存贮在以CD-ROM为代表的只读光盘系列产品、WROM光盘和可擦写光盘等容量存贮器中。其中以CD-ROM使用得最为广泛。它具有存贮容量大;成本低、出版周期短、制作简便易于开发、便于携带使用等诸多优点。因而能经受得起市场的考验,发展十分迅猛。如美国微软公司1995年推出的Encarta电子多媒体百科全书,就做在一个一盎司重的CD-ROM光盘上(650MB存储容量)。这种典型的电子出版物包括2.6万个论题、900万字的文字、8小时的声音、7000张照片和插图、800张地图、250张交互图表和表格以及100张动画和电视图片(clips)。其售价不足100美元,而印刷版或其它媒体形式的同种百科全书通常价格都在几百到几千美元之间。这种巨大的技术优越性不仅大大节约了存贮空间,而且更便于人们查询和检索,迎合了人们既看文字和图像、又听声音的阅读喜好。

从信息存储的角度来说,磁盘组(magnetic disk arrays)和光盘自动存取装置(CD-ROMJukeboxes或autochangers)这样的海量存贮设备,为现代图书馆存贮大量经数字化转换的传统书刊文献提供了足够的空间。美国图书馆技术专家W.Saffady曾以图书为例进行过一番计算:一本6×9开本大小的300页英文图书,每页大约有3500个字符,用字符编码形式加以存贮约需3.5KB的空间(假定不做全文标引),整本书以字符编码形式存贮约需1MB的空间。而一张1.3GB的光盘(5.25英寸)可存贮1300本这种300页的英文图书。美国惠普公司推出的H-P200XT型CD-ROM自动存取装置可装载144张这种光盘,提供的存贮容量达187.2GB(144×1.3GB),足以存贮字符编码形式的、不做全文标引的18.72万册300页英文图书。Saffady进一步对比了H-P 200XT型CD-ROM自动存取装置同缩微胶片和缩微胶卷的存贮容量,指出“存贮18.72万册图书的内容将需要9.36万卷缩微胶卷(35mm)或者573060张缩微胶片”。另外,美国柯达公司生产的Model2000型CD-ROM Jukebox系统具有更大的存贮容量,达1.48TB(万亿字节),可存贮近150万册图书,几乎相当于一个大中型研究图书馆的全部馆藏。

从上述说明和Saffady的数字计算与对比来看,现代图书馆利用海量存贮技术,尤其是磁盘组等自动存取装置,组织大型的电子信息数据库,存贮数字化馆藏是完全可能的。

三、数据库技术

数据库技术在传统的图书馆中已经得到广泛的应用。图书馆中所使用的数据库又概括分为两大类:一类是应用数据库管理系统软件(DBMS)进行二次开发建立数据库,常用的软件包括单用户关系型数据库软件(如MFOXBASE和FOXPRO等)和多用户、网络化关系型数据库软件(如SQL-SERVER、ORACLE、INFORMIX、SYBASE、INGRES等);另一类是本身带有管理软件的商品数据库,如光盘数据库、软盘数据库、硬盘数据库、全文数据库、超文本数据库、多媒体数据库等。数字图书馆中庞大的数字化信息经过规范化处理后需要以数据库的形式存储起来,但任何一种数据库都无法将如此庞大的信息量储存到一个单一的服务器中,且能保持良好的运行性能。即使能够储存和运行,对网络来说承载如此大量的传输任务也会引起网络阻塞。因而电子图书馆建设中势必要应用客户机/服务器结构的分布式数据库技术,以支持现代图书馆中联机查询数据库的需要。基于客户机/服务器结构的分布式数据库管理系统应用于电子图书馆中主要有以下几点优越性:通过client/server(即客户端/服务器端)结构的DBMS可以很容易地实现图书馆原有数据库与应用程序的集成,即能提供数据和服务的无缝集成;系统中安全性与数据库完整性都由server集中控制;client/server结构的DBMS能够为电子图书馆的联机事务处理提供高的事务吞吐量和短的响应时间,能支持成百乃至上千个用户,并使数据库系统对操作系统的依赖性减到最低程度;client/server结构的DBMS提供开放的client接口和开放的server接口,使用户不仅可以自由选用多个厂家的数据库应用开发工具,而且可以连接多个异质的数据库资源,包括关系型数据库和非关系型数据库。作为数据库技术与计算机网络技术相结合的产物,分布式数据库系统其技术已基本成熟,市场上已流行多种分布式数据库产品。在图书馆软件中常用的有:ORACLE、SYBASE、SQL—SERVER等。

四、网络通讯技术

如果说计算机技术的高速发展突破了人类生产、处理和存储信息的能力在数量、时间和智力等方面的限制,那么通讯技术的进步则突破了人类传递信息在时间和空间距离两方面的限制,两者的有机融合构成了现代信息技术的核心和灵魂,使人类身处一个“C(computer)+C(communication)创造+奇迹”的时代。计算机网络通讯技术已经深刻地改变了社会生活的面貌,使图书馆也出现了自动化、网络化、数字化的发展趋势,并使部分发达国家的图书馆从第二阶段的自动化图书馆向更高阶段的网络化数字化图书馆方向演进。计算机网络通讯技术是数字化图书馆的基本技术支撑,也是数字化图书馆实现广泛可存取性、高度开放和资源共享的根本保证。通过TCP/IP协议连接了众多PC机、工作站、大中型机及各式各样局域、广域网和Internet,用Z39.50协议,拓展和延伸了联机编目等资源共享的功能和空间。而数字图书馆的真正实现及其功能的充分发挥,还有待于通讯技术的进一步发展和完善,尤其是信息高速公路建设的逐步推进。信息高速公路通讯网的干线将采用已有的各种广域通信技术,包括光纤通信、卫星通信和微波通信,把用户接入干线网的将是光纤、同轴电缆、铜线和无线设备。其目标之一就是把现在的计算机通信能力提高几十倍乃至上百倍,构筑一个传输速率达吉比特每秒(Gbps)的高速通信网,使用户更方便地传递和处理文字、话音、图像、视频等信息,所以,信息高速公路的建成,无疑将使数字图书馆的网络环境更加完善、可获取和提供的信息资源更多、传递数字信息的速度更快,而且将使数字图书馆处理和传输多媒体数据的能力大大提高。

五、多媒体、超文本、超媒体技术

起步于20世纪80年代中期的多媒体技术已成为20世纪90年代信息技术领域中的一个热点,有人甚至把多媒体和通信视为未来信息高速公路的关键,其重要性由此可略见一斑。关于多媒体技术的定义,目前尚未规范统一的认识。但简单地说,多媒体技术是能综合处理多种媒体信息(数字化的文本、图形、图像、声音、视频等),使多种信息相互联系并具有交互功能的信息处理技术,具有集成性(多种信息媒体的集成、多种硬软件的集成、多种技术的集成)、交互性(更自然的人机交互方式)和数字化。

用户在检索数字图书馆的数据库时,需要强有力的导航工具以获取相关的多媒体电子文献,这就需要应用超文本技术和超媒体技术。超文本技术可将相关的概念经由路径或链结连贯起来,用户可用直接、非顺序的方式查检到所需的相关信息,而无需按特定的顺序阅读。超文本系统中的信息主要是文本和图形形式的(其中以文本为主),以节点形式存储信息,相关节点间以链结相联,从而实现相关节点间的非线性、联想式检索。超媒体是对超文本的扩展,它具有了超文本的大部分特点,但它能够处理的信息媒体是多种类型的,即文字、图形、视频、声音、动画、影片、照片等多媒体。超媒体系统中节点是有意义且独立完整的单位,每一节点中包含(存储)的信息可以是多媒体的组合,如文字、声音、图形、动画等多媒体;节点与节点之间的相互关联是靠链结方式串联成一个网络,链结的方式主要有参考性链结、树状结构链结、注解链结、关键词索引链结等四种方式;超媒体系统中的节点经过有意义的链结后形成开放式的网状信息结构,使用者可通过所建立的超媒体网络,超媒体系统也为用户提供较高的人机交互能力,用户可根据自己的兴趣与信息需要设定路径和速度,甚至修改内容或对内容加注解。

当前互联网上最热门的3W即使用了超文本、超媒体技术来呈现文字、图形、图像、声音等多媒体信息,为用户阅读文献提供了更加灵活的方式,即当用户阅读3W服务器中的信息时,可通过选择已设定的主题或图形立即打开另一份文件(可以是文字、图形、图像、声音或动画等),如此可一直进行下去直到用户满意为止,此外,由于3W揉合了Gopher的连接能力、Archie的检索功能和FTP的文件传输能力。因而受到用户的广泛重视和喜爱,3W服务器的发展也非常迅速。如1993年4月时全球注册的所有3W服务器才62个,1994年5月增至1248个,1995年9月时已超过3万个,1996年年底时全球3W服务器已达数10万个,目前我国有很多著名公共和大学图书馆都已在3W上建站,大中城市中已有相当一部分中学也建立了3W网站,它们不但供学校本馆读者查寻信息,还可让全世界的网络用户利用其馆藏资源。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈