首页 理论教育 书目工作效率

书目工作效率

时间:2022-02-24 理论教育 版权反馈
【摘要】:目前图书馆学界最具影响的两大元数据标准是MARC机读目录格式和都柏林核心元数据集。(二)书目信息组织效率对书目组织影响较大的是自动标引技术的应用。从20世纪50年代开始,有关自动标引技术的研究一直在进行。但另一方面,数字时代信息结构的复杂化使书目信息组织工作面临着准确高效性的挑战。(三)书目信息管理效率信息技术是一面双刃剑,它在提高我们工作效率的同时为我们带来了更高的要求。
书目工作效率_数字时代目录学的理论变革与发展研究

一、书目工作效率

(一)信息描述效率

传统的文献信息资源描述通常采用手工操作的方式,按一定的方式著录,手写或印刷在载体内。在计算机融入图书馆业务工作后,利用计算机国际标准书目著录自1971年陆续发表,为描述实体文献提供了共同的描述项目和顺序,成为传统图书馆对文献信息资源描述的依据;20世纪60年代美国国会图书馆开始采用计算机管理图书馆,尝试编制MARC数据,从而使信息描述工作步入了自动化阶段,至今50多年过去了,信息技术已经全面介入图书馆的业务管理中,信息描述工作使用计算机、网络、光电等技术非常普遍,对于提高图书馆信息描述效率、全面性,加强书目信息共享起到了巨大的作用。

元数据,其英文名为metadata,是“关于数据的数据”。目前图书馆学界认为,元数据是提供关于信息资源或数据的结构化数据,其功能在于描述信息资源或数据本身的特征和属性。元数据的格式很多,包括音频元数据、视频元数据、档案保存元数据等。目前图书馆学界最具影响的两大元数据标准是MARC机读目录格式和都柏林核心元数据集。机读目录(MARC)在20世纪60年代初诞生,对图书馆自动化产生过重大影响,目前各国都发展了各国的MARC标准。随着网络环境对人们生活的进一步影响,为解决与书目文献有关的网络资源与电子资源的连接机制问题,MARC格式增补了856字段,即“电子资源地址与检索”字段,从而利用MARC记录描述网络化电子资源(包括网页、电子期刊、telnet系统、FTP站点等)的位置、特征和提取要求等;DC元数据包括对资源内容、知识产权和外部属性三个方面的描述,包括15个元素,较全面地概括了数据资源主要特征和资源的主要检索点,主要用于对网络信息资源进行描述。元数据在信息描述工作中的运用,为信息的描述提供了普遍的、固定的模式,不仅使计算机的作用发挥得更为淋漓尽致,在进行书目信息共享时也具有很大的优势。

(二)书目信息组织效率

对书目组织影响较大的是自动标引技术的应用。从20世纪50年代开始,有关自动标引技术的研究一直在进行。自动标引技术是信息组织自动化的基础,可分为自动分类标引与自动主题标引两大类:自动分类标引技术按其实现途径可分为自动归类和自动聚类。自动归类是先分析信息资源的特征,在与各类信息资源的共同特征进行比较后,将它分入特征最为接近的一类并赋予分类号;自动聚类是在信息资源中提取特征,按照一定原则将具有相同或相近特征的信息资源分为一类,保证各类中的资源数量大致相等。自动主题标引技术包含有两种基本方式:自动抽词标引和自动赋词标引。自动抽词标引是直接从原文中抽取词或短语用做标引词;自动赋词标引则是由计算机从受控词表中自动选取词语用于表达文献主题内容。

20世纪90年代后,受到自动标引技术自身效率的极限和全文索引的逐渐采用,关键词抽取的研究得以深入,自动摘要、文档分类、主题检索等都是依赖于关键词自动提取的结果。自动摘要的概念最早来自Luhn于1958年提出的“从机器词频和分布的统计信息中,作为对词和句子有意义的计算来提取自动摘要”[19]。在自动摘要的发展过程中,逐步形成了基于文本中关键词或短语出现频率的概率统计等方法和基于语义分析和领域知识的文本理解两种方法,这两种方法正逐渐走向融合。

通过计算机与网络以及自动标引、自动文摘等技术的运用,传统类型文献的书目组织所花费的时间大大缩短。自动标引技术是信息组织自动化的基础,使信息标引效率大大提高,因为是计算机自动完成这些工作程序,效率很高。其他原本由人工方式进行的,如著录以及分类表、词表的编制和维护等工作由计算机代替,大大提高了书目信息组织的时间效率;通过联机合作编目,书目信息得到更大程度的共享。

数字化技术(或称数码化技术)是基于二进制码的信息处理技术,一般包括数字编码、数字压缩、数字传输、数字调制与解调等技术[20]。它运用0和1两位数字编码,通过电子计算机、光缆、通信卫星等设备,来表示、传输和处理所有信息。因为“二进制”本身是世界上逻辑最简单的数字,因此也是最容易实现、最为可靠的技术,这是数字化技术最大的优势所在。未来的信息社会的各种信息系统中,所有的信息媒体,不论是文字、声音还是图像,都能转化为数字形式,采用数字方式进行存储、传输和处理。纸质文献要在网络上传输,必须先把它们输入计算机,转化为以数据为主的加工模式,这也扩大了信息的加工范围,提高了信息加工深度。

但另一方面,数字时代信息结构的复杂化使书目信息组织工作面临着准确高效性的挑战。传统文献结构以线性为主,文献是信息组织的单元,图书馆通过分类、编目、索引,编写文摘等方式可以对其进行有效揭示与组织。而数字化的信息资源不仅有普通的可以结构化的电子文本,还有图像、音频、视频、软件等各种类型的信息。这类资源呈现立体、多维网状的结构特征,仅仅用传统的信息组织方法只能对其类型、内容、版权等信息进行浅层次的揭示,对资源的本质结构特征不能很好地展示,如何准确无误地对数字信息进行组织,使其能够最大限度地被利用是需要研究的。

(三)书目信息管理效率

信息技术是一面双刃剑,它在提高我们工作效率的同时为我们带来了更高的要求。计算机的运用使我们基本摆脱了人脑人工处理书目信息的阶段,计算机的高效信息处理能力,使批量地管理书目信息成为可能。对书目信息进行整序,通过互联网,图书馆联盟间能够共同完成书目信息的管理工作,使能够处理的书目信息量更大。

但数字信息本身所具有的易于生成、复制与传播的特点,因而在其生成阶段,缺乏像印刷信息生成所具有的一个完善的选择、评价制度,信息的质量不易保证。因而我们对数字化信息控制的手段、力度要更强。网络信息资源通过超链接的方式将图片、文字、音频和视频信息集合在一起,节点与节点之间有多种途径进行连接,因此网络信息单元间可实现多维切换,这为用户从多角度检索信息提供了方便,但也使得网络信息单元间的关系错综复杂,模糊不清,缺乏参照系统;并且网络信息资源的定位存在很强的动态性,在OPAC中,中文数据库尚不能稳定彻底地支持开放链接(OpenRUL)标准,链接地址稳定性差,信息源数据的更新或任何一点地址变动都可能产生死链,影响使用。

1998年,Roy Tennant提出,我们需要实现“数字化书目”。所谓数字化书目,就是“索引”和(或)“主题网关(subject gateway)”,它们与通常的网络编目存在明显的区别。Roy Tennant认为,数字化书目关注的是书目的基本的构造,而不仅仅是收藏资源的深度和广度。数字化书目应该具有的特点有:具备评估资源的能力;能够为资源添加注释,无论是描述性的还是评价性的;能够对链接进行定期检查,并作为系统标准化的部分;可以根据特定的用户或目的进行定制服务;书目记录可以通过附加的主题词或非受控关键词得到完善[21]

(四)书目情报服务效率

数据库、资源整合等技术的运用,使数据更新的速度、检索的效率大大提高。OPAC利用Z39.50协议对元数据格式不同而形成的异构数据库进行了整合,使得同时访问多个异构数据库成为现实。同时,以Web浏览器为窗口,将Z39.50协议与数据转换接口API结合嵌入服务器端,用户便可以通过浏览器远程访问多个数据库。在异构系统之间采用统一元数据描述语法格式XML(Extensible Markup Language),能够实现数据跨平台传输,从而通过一个入口实现高效跨库检索。而通信技术的发展与互联网的完善则使信息资源的远程传输成为可能,用户能够通过网络远程获取书目信息,比传统方式远距离传输书目信息的效率大大提高。图书馆的信息传输能力的提高需要充分利用多网络和多技术的支持。目前,通信界和计算机界正呈现出电信网、有线电视网和计算机网“三网合一”的发展趋势,这对于整合通信网络,加强信息的深层开发和组织是大为有利的。而光纤通信技术、流媒体技术的不断完善和信息服务质量QOS(Quality of Service)研究的不断深入也为互联网信息传输能力的加强提供了保障。一些新技术的采用也使书目服务的效率得以提高,如博客技术在书目信息系统的应用。Wpopac是以博客形式发布的馆藏目录,由Plymouth州立大学Lamson图书馆的信息构建师在2006年12月开发。Wpopac提供的服务包括:用户能够对每一条馆藏记录进行评价;个人博客上对馆藏的评价也与图书馆目录建立了联系;新入藏的书目记录能够通过RSS实现新书提醒的服务等。用户能够不用登录图书馆网站了解新的书目记录,而图书馆能够及时获取用户对书目信息的反馈,从而提供更好的书目信息服务。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈