首页 百科知识 医学文献检索工具和文献数据库

医学文献检索工具和文献数据库

时间:2022-06-20 百科知识 版权反馈
【摘要】:医学文献检索工具是用以报道、存贮和检索医学文献信息线索的工具。医学文献检索工具是对一次医学文献收集、整理并给以文献检索标识的产物,同时又是检索医学信息的主要手段和条件。文摘性检索工具中的文摘是文献题录加内容提要。正文部分是检索工具的主体部分,由大量的文献条目组成,为检索者提供了判断文献内容是否符合检索提问要求以及获取原始文献线索的依据。

第五节 医学文献检索工具和文献数据库

一、医学文献检索工具

医学文献检索工具是用以报道、存贮和检索医学文献信息线索的工具。所谓文献信息线索,就是指描述文献外表特征和内容特征的检索标识。医学文献检索工具是对一次医学文献收集、整理并给以文献检索标识的产物,同时又是检索医学信息的主要手段和条件。检索工具一般具有以下3个条件:详细记录所著录的文献线索;根据检索标识查找所需文献;提供多种检索的手段,提高检索效率。

(一)检索工具的形式

1.书本式

又称印刷式文献检索工具,包括:①期刊式检索工具,是将文献条目及索引有序排列的定期或不定期连续出版物,通常是以年、卷、期为单位;②单卷式检索工具,是以某一学科或专题为检索内容,收集和集中报道若干年内该领域的文献,可定期或不定期出版;③附录式检索工具,是不单独出版,附于图书、期刊之后的参考文献和引用目录。

2.卡片式

卡片式是将所需内容摘录在卡片上分类排列而成,组成分类目录、书名目录、主题目录等检索工具。

3.缩微式

缩微式是一种摄制在缩微胶卷或胶片上的文献检索工具,通过缩微阅读机才能阅读。

4.机读式

机读式是存储在磁带、磁盘、光盘等载体上的文献数据库,可将文本、图像、声音结合在一起,具有存贮量大、阅读速度高、检索途径多、更新速度快等特点。

(二)检索工具的类型

按照文献信息著录的方式划分文献检索工具,分为以下类型:

1.目录(Catalogue)

目录是按照对出版物外表特征进行著录而成,以书或刊作为目录的基本单位,著录项目包括书名或刊名、著者、出版项目(出版者、出版地、出版年月、版次和页数、开本、定价)等内容,并按一定的编排体例进行编制,是检索馆藏文献必不可少的工具。

目录有很多种,按职能划分有国家书目、出版社目录、馆藏目录和联合目录及专题文献目录,按收录的文献种类划分有图书目录、期刊目录、标准目录等。图书馆常用的目录有4种:

(1)分类目录 按学科门类逻辑次序编排,从总论到各论,从一般到具体,从简单到复杂,从低级到高级,分门别类进行编排,配有分类号码的检索系统,有系统性强的特点。

(2)书名目录 按照书名或刊名的字顺用一定的排列方法而编排的一种目录,便于读者从已知的书名或刊名途径查找文献。

(3)著者目录 按著者的字顺编排的目录,中文按汉字的笔顺排列,也可按汉语拼音排列;外文按外文字母顺序排列,可将某一作者的全部著作排列于其名之下。

(4)主题目录 用规范化的语言描述文献内容的主题所制成的目录,它能把同一主题的文献集中在一起,便于读者查找。

2.索引(Index)

索引是著录文献的内容与外表特征,并按一定顺序排列而成的检索工具。索引所著录的单位往往是一篇论文或某一出版物的内容。索引收录文献较多,报道量大,它常常附于图书、期刊、年鉴、手册、专著的后面,也可单独成册。根据内容不同,索引又分为主题、分类、属类、人名、地名、机构、代号索引等。

3.文摘(Abstract)

文摘是对一篇文献(或一个文献单元)的内容所作的简略、准确的描述,通常不包含对原文的补充、解释或评论。有些文摘与原始文献在一起刊登,叫篇首文摘。文摘性检索工具中的文摘是文献题录加内容提要。读者通过文摘进行文献取舍判断,可节省阅读全文的时间。各国原文的文摘多为英文,可以克服文种障碍,便于用计算机检索全文。

(三)检索工具的内容结构

检索工具内容结构一般由5部分组成:

1.使用说明

使用说明概括介绍编制目的、方法和原则,使用范围,收录年限,文献条目的著录格式,说明使用代号、查找方法及注意事项等。

2.目次表格

目次表格揭示正文各部分的名称和排行次序及所在页码。

3.正文部分

正文部分是检索工具的主体部分,由大量的文献条目组成,为检索者提供了判断文献内容是否符合检索提问要求以及获取原始文献线索的依据。

4.索引部分

检索工具的功能主要体现在这一部分,为提高检索效率,可利用各种索引,如主题索引、著者索引、专利索引、药名索引等。

5.附录部分

附录部分包括引用文献表、术语、文种与名称、译名、缩写与全称对照表、文献收藏单位等。

二、医学文献数据库

(一)基本概念

计算机文献信息检索系统的构成,从系统功能上来看,一方面,可谓“逻辑构成”,主要包括几个子系统:信息源选择与采集子系统、标引子系统、建库子系统、词表管理子系统、用户接口子系统、提问处理子系统。另一方面,可谓“物理构成”,包括计算机硬件、软件、数据库、通讯线路和检索终端5个部分。以下重点介绍数据库部分。

数据库(Database或Databank)作为计算机科学中的专业术语,是指在计算机存贮设备(如磁带、磁盘、光盘等)上合理存放的相互关联的数据集合。文献数据库是一定专业范围内的文献信息记录及其索引的集合体,是计算机文献信息检索系统的重要组成部分,是信息资源、文献检索的对象。

1.文献数据库的类型

按文献的内容可分为3类:

(1)书目数据库(Bibliographic Database) 是印刷型文献检索工具(如文摘、索引等)相对应的文献数据库,且内容更为丰富。如美国IM相应的文献数据库是MEDLINE,荷兰《医学文摘》(Excerpta Medica,EM)相应的文献数据库是EMBASE等。

(2)事实数值数据库(Fact-Numeric Database) 是以摘录或编辑一定专业范围内的科学事实或数据为内容的数据库。如美国国立医学图书馆建立的艾滋病临床试验数据库(AIDS Clinical Trials)。

(3)全文数据库(Full Text Database) 是记录原始文献全文的数据库。如陕西中医研究所建立的中医经典古籍《素问》《灵柩》全文数据库、CNKI的《中国期刊全文数据库》《中国优秀博士论文数据库》等。

按文献的存贮和检索方式,文献数据库还可分为:磁盘数据库、光盘数据库、联机数据库、网络数据库等。

2.文献数据库的结构

数据库的种类虽然多样,但其结构大致相同,一般由以下几个部分组成:

(1)记录(Record) 是构成文献数据库的信息单元,每条记录描述一篇原始文献的外部和内容特征,如一篇期刊论文的题录、主题词、文摘等。书目数据库中的一条记录通常代表一篇书目文献,事实数值数据库记录的则是某种信息单元,如一种药物的理化数据、一种治疗方案等。

(2)字段(Field) 是比记录更小的单位,是组成记录的数据项目。如一篇期刊论文记录可由篇名(TI)、作者(AU)、来源(SO)、文摘(AB)等多个字段构成。每一字段通常可由一个字段标识符表示,如TI(Title)、AU(Author)等。

(3)文档(File) 是数据库中一部分记录的集合。大型数据库包含大量的记录,划分为若干文档,便于选择检索。如MEDLINE数据库分为现期文档和若干回溯文档(MED66、MED75、MED80、MED90)等。从另一种意义来说,文档是数据库的结构。无序的记录必须进行合理的组织,建立一个顺排文档(Serial File)和至少一个倒排文档(In-verted File),彼此相互关联,才能构成可供检索的数据库。顺排文档是以记录为单位,按输入顺序编号(存取号)排列生成的文档。倒排文档是从记录中抽取有检索意义的数据,如主题词、关键词、著者名、药物名等文献特征为标识,并按一定顺序(如字母顺序)排列生成的索引文档。检索时先查倒排文档(相当于先查索引),然后再从顺排文档中抽出文献记录内容。

(二)光盘数据库检索

光盘是高密度光盘(Compact Disc,CD)的简称,是在激光视频录放技术基础上发展起来的光存贮技术,是20世纪70年代末问世的新型信息存贮介质,能存贮数据、文字、图像、声音、动画等各种信息,具有密度高、容量大等特点,是微型化的数据库。每片光盘的存贮量在60亿个字符以上(约650MB),可存贮6套《大不列颠百科全书》的内容。

1.光盘的种类

按照读写方式,光盘可分为3种。

(1)只读型光盘(Compact Disc-Read Only Memory,CD-ROM) 是第一代光盘,应用最广泛,写入信息后,用户只能读出写在上面的内容,但不能改变盘上的内容,也不能增加新的内容。CD-ROM具有存贮量大、稳定性好、使用方便、节省空间、可长期保存等优点。

(2)一次写入型光盘(Write Once Read Many,WORM) 是光盘的第二代产品,用户可根据自己的需要录入数据,可供反复读取数据,但不能修改或擦除已录入数据。

(3)可擦除型光盘(Optical Random Access Memory,ORAM) 是光盘的第三代产品,它不仅可写入数据,而且可像磁盘一样任意修改或删除数据。

光盘数据库的内容非常广泛,覆盖面包括自然科学、社会科学的各个方面。与医药学有关的CD-ROM也很多,如英文数据库有MEDLINE、CA、BA、EMBASE、SCI、国际药学文摘数据库(IPA)、药理毒理数据库(TOXILINE)等;中文数据库有中文生物医学文献数据库(CBMDisc)、中医药文献数据库、中文科技期刊篇名数据库、中国学术期刊数据库(光盘版)(CAJ-CD)、中文生物医学期刊数据库(CMCC)、中国科技论文与引文数据库、中国专利文献数据库等。

2.光盘数据库检索系统

(1)光盘工作站 由普通计算机、光盘驱动器和一台打印机构成。硬盘中装入与光盘配套的检索软件。光盘出版商常常修订这些软件,使其功能更强、更易于使用。

光盘驱动器读取信息速度很快,读取一次的平均响应时间不到半秒。从光盘上检索出的信息可以转存于计算机中的硬盘或软盘上,单独存贮或与其他资料一起,建立小型专题数据库供长期利用,也可直接由打印机上输出。

(2)光盘网络 一个光盘工作站只能供一位用户使用,每次检索一张盘片。使用光盘网络,用户能利用个人计算机通过本地局域网或通过远程拨号连接网络,实现一人同时检索多个光盘数据库,或多人共享同一光盘数据库。

由于利用大容量硬盘组成阵列建立的新型光盘检索网络,可以把光盘数据库的内容镜像或缓存到硬盘上,以取代部分光盘的存贮和检索功能,明显提高了检索速度;同时大部分光盘软件也能把各种光盘数据库挂接在World Wide Web(WWW)页面上发布,用户可以通过客户端浏览器远程检索这些光盘数据库,明显提高了共享能力。

(三)远程数据库检索

远程数据库是利用现代通讯技术,不受时空限制,检索远在异地计算机系统中数据库的检索方式。上世纪90年代以来,由于计算机技术与通信技术的紧密结合,大大地推动了以信息资源共享为目的的计算机互联网络的迅速发展。国际互联网作为世界上最大的计算机互联网,不仅汇集了全球的各类信息,而且作为一种全新的方便快捷的知识传播库工具,几乎可以实现所有数据库的远程检索。从用户的利用方式来看,远程数据库检索可分:光盘数据库检索、联机数据库检索、网络数据库检索。

1.联机数据库检索

联机数据库检索是由国际联机检索系统提供的数据库检索,其中最有代表性的是DIALOG系统和MEDLARS系统。

(1)DIALOG系统 是目前世界上最大的商业性国际联机检索系统,拥有450多个数据库(600多个文档),数据库记录总数占世界各联机检索系统数据库文献总量的50%以上,其内容包括科技文献、专利和商标、产品设备、报纸新闻等,提供信息范围广泛,服务富有特色而享有“国际百科”的美誉。与医药卫生有关的数据库,如国际药学文摘(IPA)(742文档)、美国化学文摘(CA)(399,308,314文档)、医疗保健设备目录(Health Devices Source Book)(188文档)、生物学商情数据库(Biobussiness)(285文档)等。

DIALOG系统服务具有以下特点:

①推出多个WWW网站,采用对话框检索方式,仅通过在对话框中输入检索词及通过下拉菜单选择范围、语种、年限等限定即可进行一般检索。使用户免去掌握复杂的指令。

②通过WWW网站(library.dialog.com)可以查阅其数据库目录、蓝页等,了解DI-ALOG系统服务及动态。

③免费提供蓝页(Blue Sheets)。蓝页是有关数据库内容、年限、规模、更新周期、记录举例、可检索字段及价格等的数据库说明和检索方法指南。

④提供One Search检索,即使用一个检索提问可自动在指定的一组数据库中同时执行检索,并将检索结果汇合输出,节约时间和费用。

⑤提供低价位、多数据库索引文档,如File 411为DIALOG数据库总索引,可作为数据库选择工具,以测定哪些数据库包含有用户指定课题的最多信息。提供特别编制的低价位培训文档On TAP(Online Training and Practice),供用户练习检索相应的正式数据库。

(2)MEDLARS系统 MEDLARS系统(Medical Literature Analysis and Retrieval System,医学文献分析与检索系统)是美国国立医学图书馆建立的大型生物医学文献数据库联机检索系统。与DIALOG系统不同,它是非商业性的,是不赢利的,目前共40多个联机数据库。其中MEDLINE(MEDLARS ON LINE)即医学文献联机数据库,是最大且使用频率最高的生物医学文献数据库,它收录了1966年以来世界上70多个国家3 700余种期刊文献,以文摘或题录混合的方式报道,其中文摘约占75%左右。内容涉及生命科学、自然科学、社会科学、化学、药物、技术与设备、信息科学等与医学相关的学科,从而成为检索世界生物医学文献最为重要的资源之一。

随着光盘技术的不断发展,已有多家著名的光盘公司被授权将MEDLINE内容转换成光盘产品,称为MEDLINE光盘数据库(MEDLINE CD-ROM),如银盘(Silver Plat-ter)、剑桥(Cambridge)、Dialog等光盘生产商。我国自1986年开始引进MEDLINE CD-ROM。

2.网络数据库检索

20世纪90年代,互联网和WWW使信息的存储、检索和利用发生了巨大的变化,实现了全球通讯和信息资源共享。网络检索是联机检索的延伸。

(1)商业性网络数据库 主要是指出版商和数据库生产商在互联网上发行的出版物和数据库。如电子图书、电子期刊、电子报纸等一次文献数据库,也有文摘索引等二次文献数据库。网络数据库通常经订购后直接通过互联网访问检索或经本地镜像点检索,同时依托网络发行传递,已经能够提供二次文献检索、一次文献原文及最新文献报道等一系列的服务。例如,Uncover期刊数据库由美国CARL公司发行,是当前世界上规模最大、内容更新最快的期刊网络数据库之一。我国从1998年开始建设的中国高等教育文献保障系统(China Academic Library and Information System,CALIS)已引进了包括Uncover数据库在内的一批网络数据库,并通过中国教育与科研计算机网(CERNET)提供网上远程检索服务。Uncover收录了17 000种期刊,用户一次可选择最多50种期刊或者最多提问25个关键词,以获得有关的最新文献线索。该项服务每周一次,将检索结果发送到用户的电子邮件信箱,用户通过回复电子邮件或传真方式订购所需要的原文。

此外,还有大量的网络数据库存在于Internet上的虚拟医学中心(Virtual Medical Center)、虚拟图书馆(Virtual Library)或虚拟医院(Virtual Hospital)之中。

(2)网上馆藏目录数据库 网上馆藏目录数据库是各图书馆现实馆藏文献的检索系统,由多家图书馆联合编制的馆藏目录数据库,也称为联合目录数据库。虽然电子出版物数量与日俱增,但目前尚不可能完全取代印刷型出版物,现实馆藏文献仍以印刷型文献为主。因此,馆藏目录数据库和联合目录数据库在揭示馆藏文献内容和检索、利用馆藏及馆际互借、资源共享等方面仍然发挥着重要作用。

全世界各类型图书馆已有大量馆藏目录数据库通过因特网对公众免费开放,这些图书馆馆藏目录数据库称为“联机公众可检索目录”(Online Public Access Catalog,OPAC)。如美国国立医学图书馆馆藏目录数据库网上检索(http://www.nlm.nih.gov)。我国CALIS系统也将建成以重点院校为主体的全国高校中外文书刊联合目录数据库以及7个地区级书刊联合目录数据库,可通过CERNET提供网上检索、馆际互借和文献传递。

(四)网络文献信息的质量和效率评价

1.文献信息质量

①光盘数据库、联机数据库和正式出版物的网络数据库,都是拥有版权的商品化数据库,其信息内容经过正规的编辑和审查,数据录入经过较严格的选择,因而文献信息质量比较可靠;②网络信息资源中的电子图书、电子期刊等,与传统的图书、期刊有着相同编辑审查机制,其信息同样比较可靠;③因特网上某些电子信息源由于缺乏正规的编辑审查程序或出于商业目的,内容的可靠性比较差,甚至存在大量无用、虚假、有害的信息。

2.检索准确率

①联机数据库等传统数据库,收录内容来源可靠,建立文档时进行了规范化的分类或主题词标引,成为严密的检索系统,因而检索准确率较高;②因特网上提供的许多信息采用超文本组织方式,由表示知识或信息单元的节点和链路构成一种结构层次化的动态组合,适于便捷浏览,但准确性较差;③用于网络信息检索的WWW搜索引擎,目前由于标引和检索机制还不够完善,不能像对传统数据库检索那样反复修改检索策略,因此难以达到理想的准确率。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈