首页 理论教育 传统图书馆的自动化技术在数字图书馆的延伸与创新

传统图书馆的自动化技术在数字图书馆的延伸与创新

时间:2022-03-10 理论教育 版权反馈
【摘要】:我国图书馆界专家大多认为,数字图书馆必须有三个技术基础:一是图书馆管理的自动化,二是文献信息的数字化,三是信息传输网络化。从图书馆的整个发展来看,“数字图书馆”与“自动化图书馆”等名词一样,将成为图书馆发展过程中某一个发展阶段的标志。所以,传统图书馆的自动化管理的相关技术,虽然还被自然地带进数字图书馆,但如果不向前延伸和发展,不在新的领域里有所创新,就不能在飞速发展的信息技术革命中有立足之地。

第一节 传统图书馆的自动化技术在数字图书馆的延伸与创新

我国图书馆界专家大多认为,数字图书馆必须有三个技术基础:一是图书馆管理的自动化,二是文献信息的数字化,三是信息传输网络化。这其中图书馆自动化和信息传输网络化也是图书馆管理自动化的主要特征,只不过在自动化阶段程度低,在数字化阶段程度高而已。尽管如本书上一章所述,传统图书馆自动化与数字图书馆存在一些根本区别,但是这种区别并不是本质区别,而是一种发展中的区别,决定图书馆存在与消亡的根本因素是社会政治、经济、科学技术和文化发展的需求。传统图书馆和数字图书馆都以信息的收集、整理、组织加工和传递为核心和主要任务的,尽管由于信息和网络技术的发展和应用,使二者在工作模式和范畴等方面出现诸多差别,但在本质上传统图书馆与数字图书馆存在一种发展的持续性,这些差别恰恰代表了传统图书馆面临各种新技术的挑战,必须适应社会发展的需求,充分应用各种信息技术和网络环境才是进行发展与创新的方向。

从图书馆的整个发展来看,“数字图书馆”与“自动化图书馆”等名词一样,将成为图书馆发展过程中某一个发展阶段的标志。并不是一种图书馆的替代名词或一种新的图书馆类型,它只代表了某些具有转折性影响的新技术应用于图书馆的开始,而当这些新技术成熟和广泛应用普及后,这些名词和概念也将逐步消失。我们现在所理解的“数字图书馆”某些功能和表现形式,也将随着有关信息技术的普及应用而消失。所以,传统图书馆的自动化管理的相关技术,虽然还被自然地带进数字图书馆,但如果不向前延伸和发展,不在新的领域里有所创新,就不能在飞速发展的信息技术革命中有立足之地。

一、Z39.50的发展与变革

Z39.50是信息检索应用服务定义和协议规范的简称,最初由美国国会图书馆等机构开发。1998年以版本1成为美国国家标准,截至2001年已发布了四版。国家标准化组织(ISO)1996年将其采纳为国际标准,定名为ISO23950。

Z39.50起源于图书馆界,最初是针对图书馆机读目录简称(MARC)数据库共享而开发的标准,现在其主要应用领域仍然是图书馆的联机书目检索服务。MARC起源于美国国会图书馆1965年1月提出的“标准机器可读目录记录款式的建议”,1971年MARC格式被确定为美国国家标准;1973年,它被ISO审定为国际标准,即著名的“ISO 2709”。

Z39.50协议具有丰富的语义,良好的互操作性和强大的功能,协议屏蔽了不同的服务提供者的数据库间的异构性,使用户能够以统一的接口查询所有的Z39.50服务器。采Z39.50协议还有一个很重要的优势,就是实现了真正的联机编目,节省了大量的编目时间,提高了编目质量。

Z39.50通过对编码方式和内容语义的标准化来实现不同系统间的互操作。在Z39.50中,协议数据单元都通过ASN.1进行定义,并以基本编码方式(Basic Encoding Rules,BER)进行对ASN.1的序列化。该协议规定了11类信息检索服务功能:初始化、搜索、浏览、检索、删除结果集、访问控制、记帐/资源控制、排序、解释、扩展服务和终止。

Z39.50初衷主要是为了满足检索USMARC格式的书目信息而提出OSI应用层协议;其目的是通过规范查询格式,简化检索过程,实现异构信息系统之间的通信,在图书馆领域有着较为广泛的应用,尤其是一些著名的图书馆都提供基于Z39.50协议的服务。Z39.50标准是一种开放的网络应用协议,支持MARC语法,支持元数据检索,所定义的一些服务具有独立性,通过自我编码和解码及一定的机制,灵活动态地选择和容纳多个检索系统,并发的发出检索请求,将返回的结果进行整合以统一的方式输出给用户。这样,用户通过屏蔽异构信息间的差异来达到资源整合,形成统一的、完全有效的操作范式。这种范式不仅具有商业索引擎的高动态更新、即时获取信息等特点,也拥有传统图书情报领域对信息资源高质量的开发和利用的优点,从而实现对Web上的异构数据库进行检索,实现信息资源有效共享和利用。

在2001年国际Z39.50实施小组会议上,有专家提出了以Web服务方式实现Z39.50的一些规范。这些规范的基础是Z39.50和XML,HTTP的Web技术,被称为新一代的Z39.50,又称“基于XML的Z39.50”,其最终目的是通过新标准来整合和检索不同的地域的网络信息资源,使其更容易被数字图书馆的远程查询技术所利用。新的标准在通讯数据编码方面有很大的变化,几乎完全放弃了原Z39.50标准所依据的编码方案,使用可读性强的XML格式文本作为通讯编码格式,简化了编码和编码过程。Z39.50与XML技术的结合,是网络环境下未来数据库通讯技术发展的主流方向。

由此可见,Z39.50在自动化图书馆时期主要是为了检索不同系统软件间MARC格式的文献书目数据,而到了数字化图书馆,是要通过Z39.50和万维网浏览器远程访问书刊的全文数据库,从过去的书目数据检索到全文检索。

二、多媒体信息存贮和检索技术

在前一章提及数字图书馆文献和信息的存贮检索和阅读,不仅仅局限于过去的用眼“视”,而且可用耳“听”,将来甚至可以用鼻子“闻”。要实现这些,需要强大而前沿的技术支撑。

20世纪90年代,国外就有人开始了基于内容的多媒体信息检索方面的研究。过去,人们习惯用概念和词句来查询文献信息,现在可以用视觉(如一幅山水图,可代替一篇散文让读者去品味),听觉(一首歌曲,一部交响乐让人去感受氛围)。所以,计算机通过扫描仪、摄像机、数码像机、话筒在线输入静态或动态(影视)的图像、音频作为查询的样本和条件。

多媒体具有各种视觉和听觉特征以及其他时间和空间关系的特征。对于同一种特征,有不同的表示方法。例如,同样是颜色特征,可以有直方图特征、颜色集、主颜色等多种特征表示法,它们从不同的角度表示媒体的特征,而如何有机地组织这些多种特征,使应用能够调用合适的特征表示来支持查询,并按照用户的查询要求合并各种特征的检索结果,是一个值得研究的问题,综合利用两种和多种媒体的特征,容易达到较高的检索率。典型的例子是检索足球比赛中的进球镜头,如果仅仅利用视频特征,则难度很大,但如果综合考虑到音频特征,检测出观众的欢呼声和解说员兴奋的关键词,就容易准确定位。因此,这里的问题是,如何综合利用多种异构特征支持用户的查询?各种单一特征的查询结果如何融合?如何利用特征之间的互补能力提高检索效率?如何既考虑一般性特征,又考虑特定领域的特征?

综合还意味着采纳其他学科领域的成果,如传统的基于文本的信息检索技术、知识发现、人工智能等领域中的方法,像布尔检索模型、多个异构特征查询表达和检索执行、知识库、分类和聚类算法、用户交互行为的机器学习等。

在学校教育教学中,这种技术尤显重要。课程教材改革后,教师备课授课方式发生了较大变化,用多媒体课件来授课,则是再好不过的现代化教具了。但在制作这些课件时,就需要在数字图书馆查询本馆及网上多媒体信息资源,组合编辑成自己的教学课件。这就要数字图书馆提供大型媒体库和集成检索中超常规数据库的索引能力。这对计算机、网络和交互检索的软件接口提出了极高的要求。由于这些新技术不断地被提出,不断地被攻克,才使得数字图书馆在人们的认识上和实践中,不停地得到发展。我们学校图书馆的人更要学习和了解这些新知识,才能为学校图书馆现代化建设中提供科学的意见和方案。

三、声频、视频传输中的流媒体技术

当图书馆计算机自动化发展到声像资料的借阅播放阶段时,传统图书馆文献收藏和读者服务管理及技术也发生了重大的变化。然而,在传统图书馆自动化管理中的声像阅览,是用磁带和光盘进行自然播放,技术要求相对低,而到了数字图书馆,读者搜索阅读浏览和收听的视频动态图像及声频音乐等,并不是用磁带和光碟在播放器上播放,而是检索和远程访问。从网站的多媒体资源库通过网络传输与适时收视电视台播放的节目不一样,用户不再是被动接收,而是个性化地发出检索要求,到对方多媒体库中边“抓”,边看和边听。视听内容的请求方,只要有所约定的权限或存贮方愿意无偿提供,那么这两端全都是无人管理的自动搜索和自动播放。因此就要用到先进的流媒体技术。

流媒体简单来说就是应用流技术在网络上传输的多媒体文件,使用它,我们可不再象以前那样访问存储在服务器上的媒体文件时,要等到整个文件传输到用户端才能开始播放。它总是将大的文件分成较小的部分,依次发送到客户端。客户端使用的流媒体播放器在接收到一定量的文件数据包后就会开始播放,而不用等接收完全部的数据才开始。这样就能满足媒体播放的实时性,并且流媒体采用了先进的数据缓冲技术,当数据到达媒体播放器后,它会自动在系统缓存中存储一定量的信息数据,然后流媒体器才从缓存中索取数据进行播放。这样一来,即使网络传输偶尔出现问题,只要缓存中还有数据,媒体就能平滑流畅地播放了。流媒体运用了先进的压缩和解压缩技术,数据压缩方式和JPEG格式图像的压缩格式很相似,只在播放时,才是由流媒体释放器进行实时的解压缩。这样可以使声音和视频文件在保证质量的前提下,压缩到很小。通常可以做到WAV和AVI文件的3%~5%,也只有这样才能适用用户的收视和收听甚至放大播放。在学校,数字图书馆的流媒体技术可以直接运用到教育教学中去。用了这项技术,教师在备课时可方便地搜索下载音频画面,还可在进行多媒体教学时,实时地接收搜索到的画面并当场演示,还可以形成网络教学中的师生互动。显示出数字图书馆强大的生命力和活力。

四、依托互联网,实现以OPAC为中心的信息门户技术

信息门户(英文为Portal)是目前比较流行的全球互联网(Web)的服务模式。人们对其的了解,首先是“一揽子”即综合解决的界面。本书将在最后二节论及的复合图书馆信息检索平台加以详述,即是此理论的一个实践尝试。其实,信息门户的内涵远不止于此。通过信息门户种种的理论和实践,有专家提出信息门户“五C”(Five c's)定义,即五个信息门户概念的英文单词的首字母;用户化(又称个性化),Customization;沟通化,Communication;商务化,Commerce;社会化,Community和兼容化,Conatiblity。“五C”中的前四个,强调了信息门户的服务理念,服务范围和深度,最后一个“C”—兼容化,却道出了数字图书馆系统在使用不同平台并检索不同资源库数字信息时,将相关技术与服务实行无缝衍接,为用户创造一个统一完整而又友好界面的美好前景。

OPAC是英文Online public Access Catalog的英文缩写。即联机公用图书馆目录。传统图书馆自动化系统上的OPAC本来仅提供图书馆馆藏书目文献查询。随着Internet网的发展,OPAC的内容不断扩展,许多图书馆的OPAC上增加报刊题录索引等检索工具,有的还增加了全文数据库和特藏资料。目前在我国学校图书馆使用的计算机自动化管理软件中,只有一、两家有真正的联机目录查询,特别是通过Z39.50的Server端被别人远程的调用,并融入到数字图书馆的文献及信息检索功能中去。传统的OPAC从提供馆藏查询到网上联机查询,再进一步提供外部的数字资源的链接。OPAC在原来的图书馆自动化管理系统中只是个不起眼的角色,而随着互联网的发展,OPAC已从图书馆计算机自动化系统的边缘产品变成整个系统的核心。因为随着中小学图书馆办馆理念和服务方式的改进,其工作重心已从过去的以收藏为主到流通为主。随着自动化和数字图书馆的出现,又将会从实体文献的流通到传统文献的目录和网络信息资源的查询利用为主。图书馆计算机自动化管理,把Z39.50和馆际互借(ISO10161/10161)等标准性协议磨合并改进后带入数字图书馆的门槛,使用户间的远程互操作成为现实。图书馆的自动化也好,数字图书馆也好,都把越来越多的文献和信息交互检索技术建立在OPAC上,并把“五C”服务作为努力目标。因此而逐步构筑成一个个图书馆的信息“门户”。我国学校图书馆,大多数都是人少,书少,传统图书馆的服务不到位,一方面,着重抓针对青少年的藏书建设,另一方面,可以面对新信息技术的出现,跨步到利用数字图书馆资源的时代,因为数字图书馆的信息资源,无需人人重复建设,只要合适的检索平台,只要有合法的链接权限,就能利用“信息门户”技术,实现学校教学信息资源的共建共享。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈