首页 理论教育 信息资源数据库

信息资源数据库

时间:2023-02-24 理论教育 版权反馈
【摘要】:用户,特别是图书馆和信息服务部门等,希望信息资源能同时被多人使用,尤其是一些光盘数据库的检索更是如此,这样图书馆和信息服务部门开始建立光盘网络。光盘数据库主要采用光盘塔、光盘库、光盘镜像硬盘塔、硬盘服务器等上网方式。广域网络版则称之为网络数据库。
信息资源数据库_网络环境下高校图书馆信息资源采访

1.4.4 信息资源数据库

信息资源数据库泛指一切数字信息的集合。通常意义上的数据库指电子数据库,即按照一定的数据模型在计算机系统中组织、存储和使用的互相联系的数据组合。数据库的规模有大有小,专业内容无所不包,提供的信息类型多种多样,因而数据库的类型也是各种各样、丰富多彩。

1.按载体形态划分

信息资源数据库按载体形态划分,可分为光盘数据库、光盘网络数据库和网络数据库。

数字电子资源的发展经历了多个发展阶段,呈现出不同的状态,从初期的磁盘型、光盘型发展到现在的网络型。在初期阶段,磁带、磁盘为数字化信息最原始、最主要的载体,通过计算机及外部设备进行阅读和利用。光盘这种用激光来记录和再现信息的高密度存储介质出现之后,被作为数字化信息的主要存储介质,广泛应用在信息处理、传播、检索与利用领域。网络的发展,把全世界各地的计算机通过网络协议连接成一个整体,形式多样的数字化资源通过网络传播,组成了庞大的网络信息资源,为人们利用信息资源提供了极大的方便。特别是Internet的发展,提供了WWW、E-mail、BBS等多种信息服务渠道和Archie数据库检索系统、Gopher菜单式数据库检索系统和搜索引擎等各种各样的检索工具,成为目前规模最大、门类最全、资料最多的信息资源库,为人们所广泛利用。由于人们利用信息资源的条件、方式不同,数字信息资源的发展还包括了不同阶段的复合阶段,如光盘网络型信息资源,就是通过网络,扩大光盘的使用范围和提高光盘的利用率,使光盘的使用从单机版发展到网络版(多用户版)。

初期的光盘主要是单机版,一般只能在一台计算机上供单个用户使用。用户,特别是图书馆和信息服务部门等,希望信息资源能同时被多人使用,尤其是一些光盘数据库的检索更是如此,这样图书馆和信息服务部门开始建立光盘网络。在计算机局域网上,用光盘作为服务器,存放大量数据供局域网上的计算机终端共享这些光盘上的信息资源。

光盘数据库主要采用光盘塔、光盘库、光盘镜像硬盘塔、硬盘服务器等上网方式。目前多数采用光盘塔(CD Tower)、光盘库(Jukebox)来实现。只读光盘型的电子资源一般都有单机版和网络版两种版本,网络版光盘数据库常常都有网络并发用户数的限制,并有局域网络版和广域网络版之分,局域网络版通常指在图书馆局域网或校园网等局域网范围内使用的网络版,也称为光盘数据库网络版。广域网络版则称之为网络数据库。

2.按数据库记录的方式划分

信息资源数据库按数据库记录的方式划分,可分为书目型数据库、题录式数据库、文摘型数据库、事实型数据库、数值型数据库和全文型数据库等。

(1)书目型数据库 图书馆或情报部门根据需要建立的馆藏书目数据库或联合目录数据库。在因特网中,图书馆将传统馆藏目录发展成联机公共目录检索系统(Online Public Access Catalog,简称OPAC),人们通过图书馆目录的URL(Uniform Resource Locator),即可以在自己的网络终端查询世界各地的大学图书馆、公共图书馆、专业图书馆的馆藏,包括各文种的图书、连续出版物、特种文献、缩微品、视听资料、电子出版物等。目前,世界上有几千个著名的大学图书馆、公共图书馆、专业图书馆及数千个学术研究机构的馆藏机读书目数据库通过网络对外开放,提供了数以亿计的馆藏书目数据及各类型馆藏资源。如美国国会图书馆(http://www.loc.gov)、中国国家图书馆(http://www.nlc.gov.cn)、中国科学院文献情报中心(http://www.las.ac.cn)的联机公共目录检索系统等。

(2)题录数据库 题录数据库又称为索引数据库。在出版物中以“篇或知识单元”作为著录单元的检索工具称为题录,如期刊中的一篇论文、图书中的一个章节等,同时揭示信息的外部特征和内容特征。常见的有篇名索引、内容索引、引文索引等。当把题录转化成数据库后,便成为题录数据库。

(3)文摘型数据库 文摘是将文献的内容加以浓缩,以最简明、最概括的文字报道文献主题、方法和结论,又称为摘要。著录信息的外部特征加上文摘,并按一定顺序排列出来,即形成文摘型检索刊物,常简称为文摘。把印刷型文献检索工具电子化或印刷型原始文献进行再开发、完全电子化便成为文献型数据库。如:工程索引(Engineer Index,简称EI)、中国专利数据库等。

(4)事实型数据库 系统存储已有的供人们检索并利用的基本事实,包括事实、概念、思想、知识等非数值信息,即为事实型数据库。

(5)数值型数据库 系统存储大量的供人们检索和得到所需要的数据,如:物质的各种参数、观测数据、统计数据等数字数据和图表、图谱、市场行情、化学分子式、物质的各种特性等非数字数据,即为数值型数据库。如科学数据库、工程数据库等。

(6)全文型数据库 存储文献全文的数据库,用户可以通过检索数据库方便地得到所需要资料的全文。从数据检索意义上来看,一种是可进行全文检索的电子图书型全文数据库,如《中国大百科全书》光盘版;另一种是文献库型全文数据库,如期刊全文数据库、学位论文全文数据库等。

3.按收录的文献类型划分

信息资源数据库按收录的文献类型划分,可分为电子图书数据库、期刊论文数据库、报纸数据库、会议论文数据库、学位论文数据库、专利数据库、标准数据库、产品数据库等。如:“中国专利数据库”、“中国标准数据库”、“中国企业事业单位数据库”、“中国科技成果数据库”、“中国科技论文与引文数据库”等。

数据库技术的发展,推动着数据库不断向前发展,由单机版光盘数据库、网络版光盘数据库向网络型数据库发展,由单一文献类型向多文献类型数据库发展,由单一学科向多学科型数据库发展。目前的数据库除了支持全文检索外,还向多学科、多元化、综合化方向发展。许多数据库生产商将其数据库联入因特网为用户提供联机信息检索和存取服务,用户在办公室、家中就能够获取数据库的信息,从根本上改变了传统的检索与利用信息的方式。例如:20世纪60至70年代,世界发达国家和地区相继建立了计算机联机信息服务系统,并发展成为国际联机检索系统,如美国的DIALOG系统、欧共体的ESA系统和德国的STN系统等,它们拥有大量著名的数据库和丰富的数字信息资源,为全世界几千万终端提供信息资源服务。Internet建立发展以来,这些大型的联机检索系统都开设了与Internet的接口,用户可通过远程登录或互联网进行付费检索。此外,有些著名数据库也在网上设置网页,并提供一定范围内的免费检索,如Ei Village、美国专利OPAT-VS等。

除了图书馆采访所要了解和掌握的主要数据库外,还有一些网络信息资源也是采访人员需要了解和掌握的。

1.搜索引擎

搜索引擎是以网页为著录单元,在Internet中主动搜索信息并能自动索引、提供查询服务的一类网站。这些网站通过网络搜索软件(又称为网络搜索机器人,Web Robots),沿着Internet的超链,搜索整个Internet上大量网站的页面,将页面上的内容进行集中处理并建立索引的数据库,当用户输入关键词(Keyword)查询时,该网站会显示包含该关键词信息的所有网址,并提供指向该网址的链接。

自1990年始于Archie(第一个自动索引互联网上匿名FTP网站文件的程序)的搜索引擎雏形开始,其发展速度越来越快。最初的搜索引擎用Robot程序像蜘蛛(Spider)一样在网络间进行扩展式检索,也被称为Spider程序。美国卡内基梅隆的Michael MauIdin将此Spider程序接入到他的索引程序中,创建了Lycos。在搜索结果中使用了网页自动摘要,并产生了远胜过其他搜索引擎的数据量,随着数据库规模的不断扩大,成为功能强大的搜索引擎。到1996年,Internet上发展了十几个大型综合性搜索引擎,此后,搜索引擎经历了三代发展,现已成为检索信息资源的重要工具。如国外的Google(http://www.google.com)、Yahoo(http://www.yahoo.com)、HotBot(http://www.hotbot.co.uk)、Excite(http://www.excite.com)等,国内的百度搜索引擎(http://www.baidu.com)、搜狐(http://www.sohu.com)、新浪网搜索引擎(http://www.sina.com.cn)等都成为人们所熟悉并广为使用的搜索引擎。

2.网络开放存取

关于开放存取,目前广泛引用的是《布达佩斯开放存取计划》(Budapest Open Access Initiative,简称BOAI)对开放存取给出的定义。BOAI指出:对文献的访问存在不同的政策和权限,而对文献的“开放存取”意味着用户通过公共因特网可以免费阅读、下载、复制、传播、打印和检索作品,或者实现对作品全文的链接、为作品建立索引和将作品传递给相应软件,进行任何其他出于合法目的的使用。上述的各种使用都不受经济、法律和技术的任何限制,除非是网络本身造成的物理障碍,唯一的限制就是要求保证作者拥有保护作品完整性的权利,同时在使用作者作品时注明相应的引用信息。

2003年6月,《关于开放存取出版的百斯达原则》(Bethesda Statement on Open Access Publishing)明确提出,开放存取出版物应该具备以下两个条件:①作者和版权所有者授权所有用户对作品的免费、广泛和长期访问的权限,并允许他们以任何数字媒体形式对作品进行公开复制、使用、传播、展示以及在原作品的基础上创作和传播其演绎作品,只要用户的使用是基于合法目的并在使用作品时注明相应的引用信息。另外,作者和版权所有者还允许用户为个人使用打印出少量的复本。②在作品发表后,应该将完整的作品版本、所有附件(包括上述各种使用许可的协议复本)要以适当标准的数字格式立即存储在至少一种在线仓储中,这些仓储由研究所、学会、协会、政府部门等机构支持,其目的在于确保作品的开放访问、自由传播、统一检索和长期存档。

开放存取作为网络环境中发展起来的新型学术理念和交流机制,受到国际社会的广泛认同和支持。开放存取资源类型多种多样,既有开放图书、开放期刊、书目数据、学位论文、音像及影像作品、电子教学资料、开放百科全书,也有开放源代码、模拟模块等资源。这些资源为读者提供了许多有价值的学术资源和公共资源,在图书馆信息资源建设中也是应该关注的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈