首页 百科知识 数字图书馆系统设计

数字图书馆系统设计

时间:2022-10-10 百科知识 版权反馈
【摘要】:数字图书馆的体系结构是在建设数字图书馆的过程中无法回避的问题。温州数字图书馆主要由6部分构成:资源采集系统、资源加工系统、用户认证系统、查询服务系统、元数据集中和仓储系统。温州图书馆数字图书馆整体建设是在相关的国际、国内标准和规范框架下进行的。

第五章 数字图书馆系统设计

一、温州市数字图书馆设计原则

1.技术先进性和成熟性

采用符合IT技术发展进步方向的成熟技术构建软件平台整体架构,满足各类电子资源从采集加工、管理到发布服务的全流程功能需求,安全、稳定、高效,充分发挥硬件性能优势,达到当前数字图书馆建设的较高水平。

2.标准性和开放性

系统设计采用开放数据和技术标准,遵循代表数字图书馆发展趋势的技术和服务标准,如Dublin Core、MARC、OpenURL、XML、OAI等。各业务系统保持一定独立,以满足进一步拓展。软件提供应具有开放的开发接口,可以方便地根据项目具体需求进行二次开发,满足个性化的需求,或实现应用集成和操作。

3.安全性与可靠性

系统需要在安全性方面有全面设计,包括操作系统、Web服务器、数据库和应用发布管理系统等,从各个环节保障系统安全、数字资源访问安全、数据安全等。除了在硬件故障的情况下,系统应该支持24小时×7天的运行模式。

4.可行性与可实施性

充分考虑具体网络、硬件环境,在完善系统的整体框架下保持开发、实施各阶段的相互铺垫和整体工作的连续。

5.可扩展性

从软件系统架构到数据管理和发布检索等各项应用的设计以及软件模块都支持开放性的结构,支持在规模和复杂程度上的扩展需求,包括对硬件和网络的扩展升级,对应用功能的扩展等。

二、数字图书馆的本质

数字图书馆是从传统图书馆发展起来的、可包容传统图书馆需求但不仅仅局限于图书馆行业应用的一种对资源的数字描述和在分布网络环境下进行服务的一种模式。数字图书馆需要开放集成各种分布、异构、多样化的数字信息资源和数字信息资源服务系统,动态构建满足各种用户群和业务流程需要的虚拟信息服务系统。

img133

数字图书馆体系架构图

右图所示是通过对馆内、分布式伙伴及互联网上的各种核心及辅助资源进行发现、描述、组织、集成和互操作,给广大用户提供对资源的浏览、查询、检索等个性化信息服务,并同时给用户提供一个学习、研究、交流与合作的交互式应用服务,这就是数字图书馆建设的基本任务。

三、温州市图书馆数字图书馆建设情况

我馆数字资源由印刷载体的数字化文献(电子书、电子期刊等)、多媒体数字化文献(音频、视频、图像)、二次开发文献(各种文本文件)三部分组成。通过外购、自建、采集网络信息资源3种途径获得。外购的数据资源主要集中在数据库、电子图书、E-journal方面。这几年我们建立了万方数据库镜像站点,购买了各种标准、人民日报、法律法规、清华同方cnki学术期刊等光盘数据库,其中标准数据库已基本收全,成为信息部一个重点服务项目。

电子图书以超星、方正、书生3家数据商的产品为主,再加工特色馆藏电子书为辅,目前本馆电子书大约有40余万种。3种格式的电子书初步进行整合,以统一的查询界面与认证入口为读者提供服务。

自建资源库这几年来主要对以下资源进行收集、加工、标引、存储、利用、传递。

(1)地方文献数字化内容涉及温州地区的市志、县志、温人温著等,到2003年为止已加工图书1350余种,格式采用超星PDG和GIF(保存用),已全部上网提供服务。

(2)南戏资源库包括音频、视频、图像和图书的数字化。

(3)鞋革资源库建立在中国鞋都图书馆资源基础上,内容有鞋样鞋款数据库、鞋革标准库、鞋革电子图书库(300多种)、本地鞋革新闻库。鞋样鞋款库目前已有16000多幅鞋款入库。

(4)温图讲座视频数据库。

(5)外地媒体看温州数据库主要是把全国各地报刊和网络媒体关于温州的有关报道数字化建立数据库,并定期为市委市政府有关部门提供外地媒体看温州的资料,为政府提供决策情报。

(6)VOD视频数据库内容主要为最新影片、经典影片、教学片、音乐片等。目前已数字化2000部2T容量。

四、数字图书馆的体系结构

数字图书馆的体系结构是在建设数字图书馆的过程中无法回避的问题。对我馆数字图书馆的体系结构分析与建立是数字图书馆系统选型的基础,同时也是我馆信息处理、存储和数字化信息服务的基本架构。根据温州公共图书馆现实的财力与技术,近期构建一个集中式的数据采集、加工、存储、管理、发布与服务中心,以后随着各馆所在地经济的发展和各馆网络化信息化程度的提高,逐步建立基于OAI模式的数字图书馆,即元数据集中存放管理检索,资源内容分布各馆存放,通过协议进行调用的温州数字图书馆体系模型是切实可行的。温州数字图书馆主要由6部分构成:资源采集系统、资源加工系统、用户认证系统、查询服务系统、元数据集中和仓储系统。

具体系统结构图如下:

img134

数字图书馆体系架构图

五、资源组织框架

1.对象数据与元数据

温州图书馆数字图书馆所有的数据资源划分为对象数据和元数据两种。

对象数据是指温州图书馆数字图书馆的电子资源,它是知识的载体,是温州图书馆数字图书馆服务的基础,亦是数字图书馆的核心。

元数据是关于数据的数据,在数字图书馆中它提供完整的数据对象描述形式。在多层级的元数据结构中,元数据可作为对象数据被其他元数据描述。由于元数据起着对对象数据进行描述、定位和指示的功能,因此在由分布式、多类型、海量数字资源有机构成的数字图书馆中,元数据作为规范的描述和整合的工具与纽带,在数字图书馆的资源描述、资源发现、资源处理、资源评价与排序以及资源的人机交互和理解等方面起着重要的作用。右图为基于对象数据与元数据模型的系统方案框架。

从功能角度而言,系统划分为四大部分:一是数据存储、相对集中的元数据(目录与索引)和对象数据的存储;二是加工系统,使得图书馆工作人员完成对象数据和元数据的采集、著录与标引;三是发布检索服务,为读者提供发布检索和互动服务,通过元数据浏览或检索找到感兴趣的对象数据;四是系统的管理调度,即对整体进行管理与调度。

img135

2.资源组织

数字图书馆资源服务的特点在于这些资源被有效地组织,温州图书馆数字图书馆资源的有效组织体现在两个层面:一是针对内部工作人员,对资源进行加工、著录标引与重组,也就是完成数据的知识组织工作,因此本系统的目的之一就是为工作人员提供方便快捷的数据组织工作平台;二是针对读者提供经过有效组织的资源服务,使得读者在图书馆工作人员数据组织的工作基础上,在数字图书馆应用平台中能够更迅速地在海量数据中找到感兴趣的资源和知识。

资源组织有两种途径:一是分类组织法,即将温州图书馆数字图书馆的资源按照某种分类体系进行组织,并在服务层面提供相应的分类导航揭示,为读者提供便捷的分类线索获取资源;二是主题组织法,即将温州图书馆数字图书馆的资源按照主题知识词典的方式进行组织,在服务层面提供相关的主题导引和主题链接,使得资源在主题层面有效地关联起来,为读者提供更好的知识服务。

3.温州图书馆数字图书馆标准规范

温州图书馆数字图书馆整体建设是在相关的国际、国内标准和规范框架下进行的。由于相关国际、国内标准和规范提供的是一种框架和方法,因此,在温州图书馆数字图书馆建设初期,需要在相关框架下进行具体的细化和明晰,而软件系统功能则是相关标准规范的实践与体现。

(1)元数据标准

温州图书馆数字图书馆建设项目前期,需要确定温州图书馆的资源描述体系,即确立温州图书馆数字图书馆的元数据标准。该标准的制定是整个数字图书馆建设的重中之重。

Dublin Core元数据集是为描述网络资源、支持网络搜索而建立的元数据模式,是Marc格式的网络微缩版,具有简单明了、语义互操作性好、国际认同、可扩展性好等优点。温州图书馆数字图书馆元数据标准以Dublin Core元数据集为核心进行扩展,确立自有的元数据标准。

元数据标准框架并未规定某种资源具体的元数据描述,是因为具体资源的元数据确定与其资源类型特点、服务的深度和标引深度紧密相关,因此需要在具体的项目实施中结合实际需求在框架中选择描述项。在最终明晰元数据标准框架时,建议遵循如下原则:

一是简单性与准确性原则。简单性主要指设计的元数据标准在著录实践时应较为简单,易于掌握。但一味追求简单性,易导致标引不够精确,会降低检索结果的准确度和精度,因此,要考虑到简单化可能导致的不准确性,需在二者中作一权衡。

二是专指度与通用性原则。由于元数据应用的各类资源的各自特性不尽相同,著录深度(如书目、内容和插图等)和广度(指相关联的一组文献作总体著录)不尽相同,因此,无法只使用一种元数据标准,需要根据具体的资源实体来确定相应的元数据标准。另一方面,必须考虑元数据标准在一定范围内的通用性。

三是互操作性与易转换性原则。元数据的互操作性体现在对异构系统间互操作能力的支持,即在我们设计的各种元数据标准下建立的元数据,不仅能方便地为自己建立的各相关应用系统所操作,还应尽可能地为其他组织或机构所建立的应用系统所操作。在具体应用上,互操作性表现为易转换性,即在所携信息损失最小的前提下,可方便地转换为其他系统常用的元数据。这要求在设计元数据标准时要非常慎重地考虑元数据标准定义的元素的语义定义和元数据结构两个重要方面。

四是可扩展性原则。由于数字图书馆将要处理的数字资源非常广泛,而各类应用背景更为复杂,元数据标准只能提供最广泛意义上的描述,一些特殊应用背景的性质内容并不纳入。但一些具体应用可能会要求更为细致精确的描述,应允许使用者在不破坏已规定的标准内容(如元素的语义定义)的条件下扩充一些元素或属性值,元数据标准中应为这种应用提供指导性原则。

(2)分类标准

资源描述分类标准采用《中国图书分类法》,选用三级简表+详表结合的分类体系,其中:三级简表部分是结合温州图书馆具体实际馆藏和学科需求,对于不常用的类目细分到3级;详表部分是对于与温州图书馆馆藏和学科紧密结合的分类,类目细分到5级。实际应用中结合温州图书馆的学科专业特色对相关国家标准进行取舍。

六、对各功能模块的具体需求

1.全文数据库检索系统

目前,数字资源的建设已从以目录型数据库建设为主发展到以全文型数据库建设为主,我馆的数据资源建设大部分是全文型数据库。全文检索系统的好坏是评价一个数字化系统的关键,作为一个适用于管理非结构化数据为主的全文检索系统应该满足以下功能:

(1)成熟可靠。该系统已经被众多的国内外企业级用户所采用,特别是在图书馆有大量的成功案例。

(2)应具有先进的中文信息处理技术。内嵌汉语自动分词系统,支持按词索引、按字索引、按关键词索引、字词混合索引,以提高检索的准确性和响应时间。应允许使用文中的任意字、词、句和片段进行检索,提供了基于文献内容而不仅仅是文献外部特征的全文检索手段。全文检索系统所提供的按词和按用户自定义关键词进行索引和检索,以及基于知识词典的扩展检索功能,能够满足特殊应用领域的高查准率和高查全率的要求。词典可维护。

(3)应具有较好的检索功能。可实现全方位检索手段,提供了多种检索运算符。包括外部特征与正文内容的各种逻辑组合检索、位置检索、二次检索、渐进检索、历史检索、词根检索、大小写敏感检索、概念检索、对检索结果按与检索表达式的相关性和重要性程度排序等。

(4)具有代理检索功能(定题检索),能够根据用户的个性化要求提供数据库的推送检索服务。

(5)支持多语种,简体(GBK)、繁体(BIG5)、西文(ASCII)、国际统一码(Unicode)。支持中西文混合检索。

(6)资源开销小,响应速度快。采用较好的数据和索引的压缩技术,具有较低(零)的空间膨胀率;在系统硬件资源允许的条件下(如服务器内存不小于1G),对超大型数据库(100万条以上记录)及结构化/非结构化复杂查询实现响应的时间能够达到亚秒级,并且不随文件数量增大而降低效率,数据库规模仅受硬件资源的限制。

(7)应具有高并发访问能力。多线程设计,支持SMP体系结构;面向全文检索的Query Cache技术;检索实例的唯一化,妥善处理不用请求,提高系统资源利用率。

(8)支持分布式体系结构,支持服务器集群,T级数据秒级响应,检索性能具有领先水平。

(9)提供中文搜索引擎,具有并行搜索、更新、自动分类和摘要等特点,在搜索调度、相关性评价、内容过滤等方面为用户提供可配置手段,系统应具有灵活性和适应性。同时,该系统应能提供海量信息库的快速查询以及先进的相似性检索技术,满足海量、多语种、高准确度、实时以及个性化搜索等需求。

(10)多种智能检索服务。相似性检索、拼音检索/同音检索、自然语言检索、相关短语检索等。

(11)应具有和主流的五大关系型数据库管理系统无缝集成,提供分布式和跨平台的灵活配置方案,支持对关系型数据库的文本数据和大对象类型数据的检索能力。

(12)提供通用数据处理工具。对各种格式文档进行辅助加工和标引,并完成自动入库。包括RTF,Microsoft Word、Excel、Power Point,PDF,S2/PS2/PS,HTML,ISO2709等格式文档。支持TEXT,RTF,HTML,XML,PDF,S2/PS2/PS,Microsoft Office等主流格式文件的转换、标引和入库,并具有开放结构,支持新的数据类型和文档格式。

(13)能够以HTML、XML、PDF等作为标准的Web输出,易于基于本系统实现Web网站站点检索系统(Web站点检索)和全文检索系统搜索引擎解决方案(Internet信息收集和导航)。

(14)应具有很好的开放性。提供完整规范的开发接口(C/Java),可满足主流平台和跨平台快速应用开发的需求,开发者只需要掌握ASP、JSP等主流开发技术,无需学习传统的编程接口。具有一致通用的跨平台、多环境的编程接口,可供开发者高效生产具有自身特色的产品。

(15)安全性好。具有系统级、数据库级、记录级和字段级四级安全控制机制。

(16)易维护、易管理,能够提供功能强大的全文检索和信息发布系统管理员工具。具有数据库维护、数据库的安全性控制、数据的完整性和一致性、数据库备份和恢复、用户管理、频道管理、发布模板等功能。管理员可设置“定时优化”的时间,降低系统管理的成本。不同平台之间,库结构自由拷贝,方便管理员操作。

(17)动态索引,即数据增删修改时快速同步更新索引,无需重建整个索引(或增量式索引更新)。

(18)除了基于文本内容的全文检索外,还具备关系数据库一样的字段概念,支持文档的外部特征与正文内容的各种逻辑组合检索。

(19)该产品还应具有其他特点。服务器的日志文件可以任意配置,即决定哪些操作要日志,可以帮助收集用户访问的统计信息。用户组的概念,以及GroupDBA的概念,适应图书馆/大型企业/政府对信息管理的需求。提供索引的直接访问功能,以支持数据的关联性处理。

2.统一身份认证系统

我馆现有维普、万方、超星、书生、阿帕比等数据库,每个数据库都有自己的用户数据库,身份验证系统必须能统一这些数据库的身份认证,可根据具体情况对上述数据库的身份认证统一到一卡通读者数据库,使读者在数字化平台上只需输入一次用户名和密码,即可完成所有库的登录任务。此外,身份认证还需满足下列要求:

(1)身份的供应和认证身份管理策略支持基于关系数据库和LDAP/CA等第三方认证系统的用户供应和认证策略,通过标准协议和第三方认证系统交互实现用户的供应和认证。

(2)用户管理实现用户的创建、删除和维护等功能,支持关系数据库、LDAP目录服务和CA认证的用户信息存储,关系数据库采用加密和签名的技术手段增强存储的安全性。

(3)组织管理支持根据现实情况创建组织模式,提供基于组织的用户管理,方便对用户的识别和管理。

(4)登录管理对用户的登录信息进行监控,并控制用户的登录有效状态。

(5)单点登录根据已有认证信息自动完成各协作应用系统的登录,支持跨域及跨平台的协作应用单点登录,支持协作应用分散和身份服务集中两种登录方式。

(6)统一退出单个退出请求,退出全部已登录协作应用,保障各系统资料泄露隐患。

(7)登录超时响应已登录的协作应用的超时事件,并执行相应的应对策略。

(8)委托管理提供用户、组织和日志的委托管理,根据用户身份执行相应的用户及其他管理功能,简化管理操作。

(9)系统管理Web方式的远程管理和控制,显示系统运行状态信息,修改系统运行参数。

(10)日志管理提供访问日志的记录、显示、查找、备份、导出等管理功能。

(11)协作应用管理对集成的协作应用进行添加、删除和更新等管理功能。

3.网上信息自动采集系统

网上信息是数字化馆藏的一个重要组成部分,我馆采用网上信息自动采集系统主要用于专题信息的收集和温州文化信息网的动态人工控制更新。模块需具有如下功能:

(1)强大的信息实时监控和采集功能

①可定制采集源和监控周期:维护人员可方便地指定监控的目标站点或页面,设定信息监控的时间周期,包括指定一天之内的多个定点执行时间,或者设定两次更新之间的时间间隔,并可设置为不间断运行。

②高效的采集技术和更新策略:采用多线程并发搜索技术,采集过程高效准确,且提供高效的更新手段,已经采集过的信息不会重复采集,更新时只获取前次采集后更新的网页。

③可采集动静态网页,适应性强:除了能够满足一般性静态网页的采集以外,系统还可以采集多种特殊形式的网页。包括:引入日期变量,使用户可精确定位并采集带有日期特征的栏目及其页面;引入页码变量,可有效采集从数据库发布出来的多页信息;预设用户名和密码,自动采集需要权限认证的站点或频道;引入链接和内容模板,精确定位采集页面局部内容。

④多语种网页的采集,可以将BIG5内码网页和Unicode内码网页自动转换为GBK后进行统一管理和存储。

⑤实现网页元数据和多媒体内容采集:每个网页的详细元数据信息被完整地识别并记录,包括网页名称、大小、日期、标题、文字内容等,网页中的图片和表格信息可同时被采集。采集过程成熟可靠,容错性强,完成初始设定后可长时间稳定运行。

(2)智能化的信息过滤、自动分类和重排等信息处理功能

①垃圾信息过滤:系统可对网页进行内容分析和过滤,自动去除广告、版权、栏目等无用信息,精确获取目标内容主体。

②智能化自动分类:采用基于内容的自动分类技术,可对采集的网页进行基于内容的自动分类,不需人工干预。自动分类的准确率基本可以满足信息粗加工或大多数应用的实用要求。同时系统提供分类训练工具,允许用户自行根据自己的分类需求和数据特点设定分类结构和生成特征模板,适应不同行业的需求。

③基于内容相似度计算的自动重排:利用内容的相似性进行重排判断,准确性高,不会因为标题或内容的少许变化而产生漏判,即标题改头换面,系统也会正确判定。同时,用户可以根据具体需求调整相似阀值,实现个性化重排目标。被排除的重复网页不会被清除,可以作为主体网页相似或者推荐网页进行显示,提供给信息用户参考。

(3)灵活的信息发布和检索

①及时发布采集到的信息:对采集到的信息可及时通过Web发布模块实时发布到网站上,并提供信息分类导航和检索功能。对于发布的信息,用户既可以查阅本地数据库中经过自动过滤的内容,也可以对照查阅原链接网页。

②支持自动发布和人工发布两种方式:在自动发布方式下,采集到的网页将自动发布到网站上;在人工发布方式下,采集到的网页需要经过维护人员选择才能发布到网站上。

③专题内容定制:支持专题定制,用户可以通过定义关键词规则来建立专题,专题包含满足规则的信息,方便用户跟踪访问特定的内容。

④配备强大内容的检索引擎:提供包括全文检索、日期检索、标题检索、关键词检索、文件大小检索、二次检索、URL检索在内的多种检索入口,方便用户使用多种方式查找感兴趣的网页。检索结果可按相关度、日期、网页大小等多种方式排序输出。

4.虚拟参考咨询系统

虚拟参考咨询是图书馆的主要网上服务内容,我馆的虚拟参考咨询系统作为数字图书馆的一个子系统,用户的认证和资源的调度要与数字图书馆相协调。系统功能图如下:

img136

(1)咨询提交和回复咨询使用多种方式接收用户的咨询。

①表单咨询:用户通过提交页面表单来咨询问题。

②实时咨询:用户进入实时咨询室,同咨询员进行实时交流。

③E-mail咨询:用户发送E-mail到咨询台的邮箱中提出咨询。

(2)回复咨询的方式支持

①非实时回复:咨询台会把用户提交的所有非实时咨询(表单咨询、E-mail咨询)综合在一个列表中,咨询员可以根据各自负责的不同方向来处理自己的咨询。

②实时回复:咨询员进入咨询室,即时回答用户提出的咨询。

(3)知识积累和整理为了方便在咨询过程中积累知识,虚拟参考咨询台提供了如下功能:表单咨询的咨询历史会自动记录积累,实时咨询室中咨询员可以编辑并保存咨询历史,除此之外咨询员还可以使用FAQ、专题知识库等多种方式积累知识。

(4)知识服务 可以通过多种方式把咨询台积累的知识提供给用户使用:用户除了可以检索和浏览咨询历史和FAQ数据库之外,还可以使用咨询台提供的专题知识库来了解固定领域的专业知识。

(5)管理功能 提供了系统管理的功能,既可以对系统词典、系统参数进行管理,也可以对提问的表单进行部分定制,另外还可以浏览系统的统计数据。这些功能大大增强了系统的灵活性和易用性。

(6)其他功能 为了方便用户和咨询员使用,虚拟参考咨询台还提供了一系列辅助功能,如系统通知、站内短消息等。

5.网站内容管理系统

我馆现在总共有温图在线、E时代图书馆、温州文化信息网、中国鞋都图书馆、南戏家园、温图影院6个网站,这6个网站除温图影院外都经常需要发布新闻,需要一个统一的网站内容管理系统对内容的发布进行有效管理,同时尽量减少网站的设计量。作为一个适合管理网站的网站内容管理系统,应满足以下功能:

(1)全B/S结构,无客户端。

(2)采用J2EE架构。

(3)支持重稿检查。

(4)支持知识库校对。

(5)支持多站点管理。

(6)对角色、机构、文档有灵活、严格的权限分配机制。

(7)文档的可视化编辑、中间版本管理、属性定义、预览、指定文档的有效性管理。

(8)多格式文件支持。提供任意文档类型的数据采集过程,能够采集包括XML、HTML、PDF、Word、Excel在内的一些流行的文档类型。

(9)文章查询。提供文章快速查询功能,能通过标题、作者、内容快速定位到系统中的某一篇文章。

(10)文章发布。文章采用单篇发布、多篇发布及定时发布等发布方式,有完全发布和增量发布两种发布手段。发布后的文章可通过FTP、文件系统共享等技术同步到其他服务器上。

(11)模板技术。通过频道及模板技术,实现内容与表现的真正分离。模板除了支持在内容管理系统内直接编辑外,还能在Dream Weaver等专业编辑器中编辑。

(12)支持工作流。采用可编辑的工作流,用户能随时修改工作流程。用户可定制不同的工作流程,应用于系统内不同频道。

(13)版本控制。提供完整的文档多版本控制和痕迹保留,提供用户修改文档的记录以及文档修改的变化过程。

(14)文章相关性。提供文档相关性管理,可以方便快捷地创建各种专题栏目,满足专题栏目即时、快捷的要求。

(15)日志管理。日志管理一方面可以记录所有操作,做到有据可查,另一方面可以根据需要通过多种方式对记录的操作日志进行检索和查询,进一步分析生成统计信息。

6.信息资源库建设系统

(1)信息资源库的创建、维护与注册内置多种信息库模板,元数据标准符合科技部规范,并可根据需要灵活定义描述结构,迅速创建符合应用需求的信息库。

(2)信息资源加工标引提供强大易用的工具,对信息对象根据元数据规范进行标引,支持各种媒体对象的挂接和转换,自动抽取元数据,智能提取文章的主题词、摘要和抽取文本内容。

(3)信息分类支持对信息对象按照分类标准进行分类描述,提供分类导航,内置中图法、科图法、地区分类法、学科分类法,并可自定义分类描述。

(4)数据的导入、导出支持RDBMS数据,MARC、CCFC等记录数据以及文本格式数据等自动批量导入并转换为信息库标准格式。信息库数据支持按照XML格式批量导出能力,便于与其他系统交换信息。

(5)资源记录审核维护提供审核机制控制记录的内容和质量,保证资源库记录的一致性、合法性及可用性。

(6)用户管理提供用户的注册、登录、管理等功能,区分加工用户、著录用户、系统管理员以及资源访问者,提供用户名密码及IP访问控制等机制。

(7)数据导航发布后的信息资源可按照分类导航、信息首字母导航及按字段导航,帮助用户快速浏览到所需资源。

(8)数据检索内嵌强大的检索功能,支持对信息资源的简单检索、一般检索、二次检索、扩展检索及高级检索功能。

(9)开放链接支持CALIS资源调度服务,支持OpenURL(开放链接)解析。

(10)数据交换提供基于OAI和MET规范的数据交换方式。

(11)日志与统计系统提供对各类操作的日志记录,并可根据日志提供多种类型的统计,包括用户操作、资源分布、检索频率、资源下载、访问量、OAI、MET访问等。

(12)系统管理和配置提供对加工系统、服务系统、交换系统等各个模块全方位的配置管理能力。

7.跨库集成检索系统

(1)一站式检索

多数据源的统一检索界面、统一检索式、统一的结果呈现方式,大大简化了多数据源检索操作的复杂度。系统遵循通用检索方式与检索习惯,提供多种检索途径和参数设置。实现了异构信息资源的集成检索。系统支持基于HTTP协议的网络数据库、Z39.50网关、本地数据库以及Web主题搜索引擎的检索,实现了对数据库的访问以及Web信息的检索与搜寻。

(2)多数据源集成

电子期刊,包括清华同方、万方数据、维普、龙源期刊网共4种;电子图书资源,包括方正电子图书、超星电子图书、书生之家共3种数据库;网络免费资源,提供对Google和Yahoo的集成检索服务;联合目录资源,包括中科院联机联合目录数据库、全国中日俄西文期刊联合目录库、广东省文献编目中心、地方版文献联合采编协作网共4种数据库;OPAC库资源,图书馆的OPAC检索。

(3)检索结果整合

可以对检索字段、去重标准、排序标准、显示记录条数等进行选择,系统自动合并检索结果,并支持二次检索,实现了真正意义上的信息整合与结果统一呈现。

①多种检索结果显示模式。系统提供简单信息与详细信息两种结果显示方式。

②多种排序方式。系统提供题名、数据库和作者3种排序方式。

③多种查重方式。系统可提供“题名”、“题名+作者”和“不查重”3种查重方式。

④二次检索。系统支持用户在原有检索结果的基础上进行二次检索。

(4)个性化定制服务

系统支持个性化设置,为用户提供了个性化资源定制和参数设定功能。

资源定制。注册用户登录系统后,可以对资源进行基于主题的定制,每一主题下用户可选择不同的数据源,检索时既支持基于定制主题的检索,也支持资源选择方式的检索。

个人信息定制。注册用户可以修改个人信息,包括密码、联系方式等。

(5)服务的扩展与整合

实现了跨库集成检索系统与原文传递服务无缝连接,支持原文传递功能,可以灵活地设置系统发送信箱。当用户不具有访问全文数据库的权限,在检索到需要的资源时,可以直接在结果显示页面上提出原文传递的请求,系统自动传递用户的信息(如姓名、E-mail等)及所需资源的描述信息(如题名、作者、来源等),可以提交给管理员或提交到参考咨询系统,由咨询馆员进行原文请求的处理。

(6)完善的系统管理

系统提供基于资源注册机制的动态管理扩展功能、统计功能和基于角色的用户管理功能。

①动态管理扩展功能。系统采用动态的资源管理机制,整体架构具有良好的可扩展性。动态注册机制包括资源注册和资源管理。

②完善的统计功能。系统提供数据库使用统计、原文请求处理统计,可以按时间段灵活地进行数据库使用、原文处理等统计,并将报表以通用的格式输出。

③基于角色的用户管理。系统采用基于角色或组的概念实现用户管理,可以动态增加角色,不同角色的用户具有不同的系统访问权限。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈