首页 理论教育 数据库实验报告结果分析万能模板

数据库实验报告结果分析万能模板

时间:2022-03-16 理论教育 版权反馈
【摘要】:全文数据库提供最原始的资料,而不是书目数据库中的文献线索。

数据库是计算机存储设备上按一定方式存储的相互关联的数据集合,是计算机信息检索系统中最重要的组成部分,是信息资源的集散地,是被检索的对象。数据库是计算机技术与信息检索技术相结合的产物,是现代重要的信息资源管理工具,是信息检索系统的核心部分之一。数据库的质量直接影响信息检索系统的功能和效率。

(一)数据库的类型

数据库的内容和形式非常丰富,包罗万象。用户必须首先了解数据库的类型,才能根据不同的检索需求选择合适的数据库。按照国际上通用的分类方法,数据库通常划分为以下几种类型。

1.参考数据库 参考数据库(reference databases):是指引用户到另一信息源以获得原文或其他细节的一类数据库。它包括书目数据库和指南数据库两种。

(1)书目数据库(bibliographic database):指存储某个领域的二次文献(如文摘、题录、目录等)的一类数据库,有时又称为二次文献数据库,或简称文献数据库。该类数据库的检索结果是所需文献的线索而非原始文献。例如,在医学领域常用的MEDLINE等数据库,图书馆馆藏资源书目信息数据库等,即属于此类型。这些数据库往往有固定的更新周期,可提供回溯检索和定题检索服务。

(2)指南数据库(directory databases):指存储关于某些机构、人物、出版物、项目、程序、活动等对象的简要描述,指引用户从其他有关信息源获取更详细的信息的一类数据库,也称指示性数据库。例如,各种机构名录数据库、人物传记数据库、产品数据库、软件数据库、基金数据库等,均属于此类。

2.源数据库 源数据库(source databases)是能直接提供原始资料或具体数据的数据库,用户不必再查阅其他信息源。它又可以划分为以下几种类型。

(1)数值数据库(numeric databases):指专门提供以数值方式表示的数据(或包括其统计处理表示法)的一种源数据库,如各种统计数据库、医学上各种理化参数、人口统计数值数据库等。

(2)事实数据库(fact databases):指专门提供事物发展过程中产生的事实数据的一种源数据库。这类数据库一般同时提供文本信息和数值数据,如美国著名的临床医生事实数据库Health Care Series能为临床医生提供及时准确的疾病急救方案、临床用药指南、药物毒理学等事实信息。该数据库在西方国家已作为医院必备的临床实践决策支持系统被普及使用。

(3)全文数据库(full text databases):指存储文献全文或其中主要部分的一种源数据库,简称全文库,如新闻消息全文库、法律法规全文库、期刊全文库等。全文数据库提供最原始的资料,而不是书目数据库中的文献线索。随着存储技术的发展,全文数据库越来越多,中国期刊网等收录的电子期刊将近1万种,就是全文数据库。

(4)术语数据库(terminological databases):指专门存储名词术语信息、词语信息以及术语工作和语言规范工作成果的一种源数据库,各种电子化辞书也包括在内。

(5)图像数据库(graphics databases):指用来存储各种图像或图形信息及有关文字说明资料的一种源数据库,主要应用于建筑、设计、医学影像、图片或照片等资料类型的计算机存储与检索。

除了上述几种类型的数据库以外,还有能同时存储多种不同类型数据的数据库,即混合型数据库(mixed databases)。另外,还可将数据库按其载体不同分成磁媒体数据库、光盘数据库和多媒体数据库。

(二)数据库的结构

数据库的类型较多,但数据库的结构基本相同。从用户的角度来看,数据库主要由文档、记录、字段三个层次构成。

1.文档(file) 若干个逻辑记录构成的信息集合称为文档。文档是书目数据库和文献检索系统中数据组织的基本形式,与检索系统的硬件和软件的功能和系统的效率有密切关系。多数数据库以单一的文档编号出现,此时,文档的概念和数据库相当。但有些数据库因规模庞大,为了方便用户检索,常被分成若干个文档。

文档可分为顺序文档和倒排文档。顺序文档指文档中的记录按序存放,记录间的逻辑顺序和物理顺序是一致的文档。书目数据库中的主文档通常是顺序将每件信息的全记录线型排序,存在磁带和磁盘上,提供物理顺序的检索。主文档与手工检索的正文部分对应,像手检工具一样,需要辅助索引配合。倒排文档是把记录中可检索字段及其属性值提取出来,按其属性值的某种顺序再组织起来,成为可以作索引用的文档,所以也称为索引文档。不同属性的字段组成不同的倒排文档。如著者字段,是把所有记录中的著者名抽出来,按序组织成著者倒排档,以指引与特定著者有关的记录文档中的地址。主文档以文献的全记录为处理和检索单元,倒排文档以文献属性(字段)为处理和记录单元。

2.记录(record) 记录是由若干字段组成的文献单元,是计算机检索系统存储文献条目和标引的信息载体,每条记录记载了一篇文献的外部特征和内容特征。在全文数据库中,一条记录相当于一篇完整的文献;在书目数据库中,一条记录相当于一条文摘或题录;其他类型数据库中,一条记录则代表一个信息单元。

3.字段(field) 字段是构成记录的基本单元,是对实体的具体属性进行描述的结果。在书目数据库中,记录中含有题名、著者、出版年月、来源、主题词、文摘等字段。在有些数据库中,根据与文献内容相关与否,文献数据库字段还可分为基本字段(或称默认字段、缺省字段)和限制性字段(或称辅助字段)两种,这两类字段在检索策略的构成方法上往往有些区别。基本字段通常是默认的主题途径检索范围,如果需要查找特定的字段,通常要以某种方法予以指定。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈