首页 理论教育 光盘数据库检索

光盘数据库检索

时间:2022-03-10 理论教育 版权反馈
【摘要】:光盘数据库一般都具备类似联机检索那样齐全的检索和输出功能,同时提供人机对话,系统界面友好。光盘数据库的规模和容量毕竟是有限的,一般都以某一学科为主,不可能囊括各种资料,而且一次也只能检索一个数据库,而联机检索、网络检索可同时检索多个数据库,且数据量大。

第三节 光盘数据库检索

一、光盘检索技术概述

(一)光盘的特点及类型

光盘(compact dis1k)是继纸张、缩微胶片、磁存贮器之后的一种用激光束、计算机、数字通信和光电集成等现代化高科技手段来记录和再现信息的存贮载体。它是一种存贮量大、价格低廉的计算机存贮设备。一张普通的光盘,信息的储存量大约在650兆(相当于存贮3亿个汉字),所有的中国大百科全书才占到一张光盘容量的三分之二多一点。光盘不仅能存贮文字、图像等信息,而且还能存贮声像、电影录像等各种视听信息。

光盘按存贮信息的种类可分为用来存贮声音信息的激光唱盘、存贮图像和伴音的激光视盘和存贮文字、数字等文件资料的数字光盘。按读取数据的性能来分,可分为:

①只读光盘(Compact Disc-Read Only Memory,简称CD-ROM)这种光盘中的信息是制造商事先写入和复制好的,用户只能读取或再现其中的信息。目前这类光盘的技术比较成熟,信息存储密度比磁盘等介质高得多,是国内外市场上CD产品的主流。它的特点是将数据先写到母盘上,然后大量复制拷贝供发行。由于采用工业化生产方式大批量生产,价格低廉,且标准统一,用户使用光盘驱动器或播放机即可读出不同厂家生产的光盘上的信息。

②一次写光盘这种光盘不仅可以读出信息,还能记录新的信息。它的存密度比CD-ROM小,适用于现场记录数据,盘片和驱动器价格较高,且尚未标准化。目前市场上可见的有:一写多读光盘(Write Once Read Many—WORM),随录随写数字数据光盘(Direct Read After Write—DRAW),光卡式光盘(Optical Card—OC)。

③可擦写光盘这种光盘不仅可多次读,而且在信息写入后可以擦掉,并重写新的信息。其容量为10MB-1GB不等,可代替磁带、磁盘,目前已进入实用化阶段。主要类型有可擦式光盘(Erasable)和编程式可擦光盘(CD-Erasable Programmable Read Only Memory,即CD-EPROM)

(二)光盘检索的特点

计算机检索主要有脱机检索、联机检索及网络检索三种方式,他们在历史的不同阶段对于获取信息的方法和技术等方面各自发挥了不同的功能。而如今脱机检索之所以又成为计算机信息检索一种常用的方式,且普及面越来越广,光盘检索在其中发挥了不少的作用。

光盘的使用起始于20世纪70年代,最初主要用于制作激光唱片。20世纪80年代以来,随之计算及技术和数字化技术的发展,光盘才开始应用于文献信息领域。光盘在文献信息领域的应用对信息的存贮介质(纸、磁介质、缩微胶片等)带来了巨大的影响,并强烈地冲击着联机检索产业。由于以CD-ROM为代表的光盘技术具有易用、存储容量大等独特的特点,因而受到了人们的普遍欢迎,并很快发展成为一种新的检索系统——光盘检索系统。近几年来随着Internet的普及使得光盘数据库受到网络数据库的一些冲击,但是光盘数据库的独特的优点使它在现代化检索手段中仍然占据着相当的地位,它的优点体现在:

①检索系统配置简单,使得投资成本低。由于是在微机上运行,建立光盘检索系统只要一台光盘驱动器和所需的盘片,不需经过通讯线路,即可构成系统。

②检索费用低廉。由于光盘的费用是一次性投入,可多次使用,利用率越高,分摊的成本越低。而且,整个检索过程不涉及远程通信网络问题,仅这一项就可节省很大一部分开支,对于通信网络尚不发达,联机检索费用昂贵或没有国际终端的地区和单位,光盘检索的优势就格外突出了。

③运行速度快。光盘数据库一般采用单机检索,即使连接在校园网上,由于距离较近,其传输速度也较快。而Internet上的网络数据库,往往由于线路的影响速度很慢。

④检索效果好,系统操作和检索步骤比较简单,便于一般用户使用。光盘数据库一般都具备类似联机检索那样齐全的检索和输出功能,同时提供人机对话,系统界面友好。没有检索经验的用户在系统提供的菜单式“帮助”指令下可无师自通。光盘系统的服务方式属于非限制性检索,用户可以充分考虑和修正自己的检索策略,直至检索结果满意为止,而不会出现如联机检索需按时间多少收费的压力

⑤下载方便。用户可以很方便地将光盘上的部分数据套录到软盘或其他计算机信息系统里,变成本部门或个人的小型数据库以便随时查询,提高了资源共享的程度。

⑥光盘系统还是用户在联机检索前进行预检和培训的有用工具。用户可在光盘上进行必要的人机对话,了解检索范围、检索策略和有关指令,优化检索策略,这样可以大大减少机检时间,节省上机费用。

(7)安全性能高。对于光盘数据库来讲,它是只读光盘,具有不可擦除性,更不会因病毒而造成文献数据的丢失。

虽然光盘检索系统的优势是明显的,但是光盘检索也有其局限性。如:

①使用范围有限。光盘数据库的规模和容量毕竟是有限的,一般都以某一学科为主,不可能囊括各种资料,而且一次也只能检索一个数据库,而联机检索、网络检索可同时检索多个数据库,且数据量大。

②更新周期长。联机检索系统可实时更新,而光盘基本上是定期更新;更新频率快则一个月,慢则一年,在一定程度上影响了数据更新的及时性,因而它不太适合于那些动态性极强的商情信息检索。

③运行速度不及联机检索快。光盘检索是建立在微机上的,响应时间不及大型计算机支持的联机检索速度快。

④检索系统不兼容。不同出版商制作的光盘数据库不能在一个系统中兼容,造成使用上有很大不便。

⑤需要不断换盘。一个大型数据库,一般都有几张光盘,特别是全文数据库,例如中国学术期刊全文光盘数据库,每年都有上百张光盘。检索时需要不断更换光盘。

因此,目前的信息资源检索,应该发挥光盘检索、联机检索、网络检索优势互补的功能。

(三)光盘检索所提供的服务

①一般的追溯性检索,引进的光盘一般储存多年的文献(5~10年),比较适合于追溯性的检索;

②提供SDI定题服务。定题服务是为了跟踪某课题的最新动态,按用户事先预定的检索内容,主动连续地从新到的文献库中检索出有关信息。由于光盘数据定期更新,数据库检索软件又具备保留和重新执行检索策略的功能(即SAVE和EXECUTE),可利用其更新数据进行SDI服务;

③提供专题检索服务。科研工作者在开始一项新课题研究时,需系统、全面了解这一课题的进展情况,因此要查找过去若干年中前人有关此课题的研究信息,称之为专题检索。由于光盘数据库的使用几乎不受时间限制,因而可以为特定用户制定专题或特殊要求(如非主题型字段)的检索服务,而联机检索系统受机时和费用的影响,一般不提供该项服务;

④套录子库。光盘数据库检索软件一般都具备完善的套录检索结果的功能,用户套录数据中的所需部分后,可利用管理软件,再按自己的要求在微机上建立子库。

二、光盘数据库检索系统

(一)光盘数据库检索系统的组成

光盘是一种信息载体,而要对其中的信息进行检索和利用则需要计算机的配合。光盘检索系统一般由以下设备组成:计算机及输入输出设备、光盘驱动器或光盘塔、相关软件(系统软件、检索软件)、CD-ROM数据库。

整个光盘检索系统的操作可通过计算机进行控制和执行,并通过计算机的输入输出设备与外界进行交流。目前所使用的光盘检索系统基本上都是建立在计算机上,在普通的计算上加载光盘驱动器的驱动软件和数据库的检索软件,即可成为光盘检索系统。

CD-ROM数据库是数据的存储单元,一般有数据库供应商提供,数据在制作过程中固定在其物理介质上,不能抹掉也不能修改。使用前应先安装光盘。快速安装光盘的一般方法是:

①查看光盘目录:将光盘插入驱动器,等光盘启动至正常旋转速度时,将驱动器字符换成指定给CD-ROM驱动器的字符(如D:),键入DIR并按回车即可显示按字母顺序排列的光盘文件目录。

②查找安装文件:查找文件名为“Install”、“Setup”或扩展名为EXE、COM、BAT的文件,最常用的是“Install”。

③运行安装程序:运行上述文件之一。运行中可能会有提示输入硬盘的字母、CD-ROM驱动器的字母、CD-ROM设备驱动器程序名、存放软件的子目录名以及为运行安装程序而生成的批处理文件名等提示。

④结束工作:通常是输入扩展名为BAT的文件名,或者在Windows环境下对着扩展名为BAT的图案按下鼠标。这时,系统将自动修改CONFIG.SYS和AUTO EXEC.BAT,以确保以后启动时自动加载CD-ROM设备驱动程序。

而光盘驱动器是光盘读取的专用设备,其发射的激光束聚焦在光盘的信息轨道上,在有小孔或无小孔处形成不同的光反射,这两种不同的光反射经光学系统接收后转换成电信号,计算机二进制信息“0”或“1”,经计算机解码后,成为原记录的数字化信息。

驱动器可安装在诸如XT、AT、Pentium以及绝大多数IBM兼容机上。驱动器是读取光盘数据的专用设备,在微机扩展槽上插入CD-ROM驱动器的接口卡就可将微机与驱动器连成一体。CD-ROM驱动器有内置式和外置式两种,前者安装在微机机箱内,可节省台面空间,价格较便宜;后者可很方便地移动到不同的计算机上。选择驱动器时主要考虑以下性能:第一,读盘速度,一般为185ms~500ms;第二,查找速度,多数在250ms~400ms之间,省查询时间;第三,数据缓冲区。数据缓冲区越大,可直接从存储器存取的数据就越多;第四,数据传送速度,有20倍速乃至50倍速以上的驱动器。

另外需说明的是,检索软件是和光盘数据库一并提供的,大多数出版商已经将安装、查询、检索程序存放在同一张CDROM上或另外一张查询软件的CD-ROM上。

(二)光盘检索网络系统

光盘网络检索系统是20世纪90年代发展起来的计算机文献检索系统。随着光盘数据库的大,量涌现,单机光盘检索需频繁换盘,给用户带来不便,而且在同一时刻只能供一个读者使用,无法充分发挥昂贵的光盘数据库的效益。在计算机网络的硬件和软件的支撑下,光盘检索网络应运而生。目前建成的光盘检索网络系统都是以计算机的局域网为基础,有多种模式,其共同特点是拥有能同时运行几十张光盘的光盘塔驱动器,有可供上百个用户同时检索同一张光盘的网络软件。

光盘数据库网络的组成包括光盘塔和各种组网软件以及光盘塔服务器组成。光盘塔是光盘读取设备,它是由多个光盘驱动器叠加而成,配以接口卡,接到局域网上,以供网络上多用户使用。光盘驱动器盘片的转速决定着数据的读取速度,盘片转速越高,数据传输越快。对于光盘组网软件,目前国际上开发的品种较多,在我国常用的软件主要有三种:Opti-net,CD-net,SCSI-Epress。支持网络传输的协议有IPX/SPX,NET-BIOS和TCP/IP。而光盘塔服务器则是光盘塔的管理设备,光盘塔服务器内置于光盘塔内。

(三)光盘数据库的检索原理

光盘数据库检索主要是指光盘文献检索,即查找含有所需信息的文献。光盘检索是采用计算机作为检索手段,以光盘作为信息存贮载体和检索对象进行的信息检索。不同的光盘数据库所提供的检索途径可能会有差异,但是数据库的结构和基本特征是相同的,因此任何光盘数据的检索原理都和计算机信息检索的原理是一样的。

三、光盘数据库的组成及结构

(一)光盘数据库的组成

光盘数据库与计算机检索的其他数据库格式(如联机检索系统)一致,也是由记录以及为查得这些记录而编制索引等事项组成。因此,编制光盘数据库时,同时通过检索语言存入记录和索引两部分。

1.记录

光盘数据库中的信息项成为记录,其类型除了有计算机数据库的主要格式目录型、文摘型、全文型、数值型、指南型外,还有一些特有的数据库类型:①纯数据(档案)光盘。CD-ROM是一种优秀的档案存贮媒体,通常可以存储的内容包括:在文件服务器中硬盘的数据,磁带上的档案,打印在纸上的信息等。②软件库光盘。专门存放各种软件的光盘,由软件制作公司发行。购买这种软件后,用户就可以从CD-ROM光盘中安装功能齐全的软件版本,用光盘方式试用和购买软件既容易又方便。现在还有各种商务分析软件、财务分析软件,可用于经营和环境分析(包括经济动态、金融情势、产业结构和社会趋势的变化)、竞争力分析(对竞争对手企业的各项指标进行测定)和风险度分析。

在这些记录类型中,全文数据库尤其受到用户的亲睐。因为全文型光盘数据库存储了政策法规、期刊、报纸等原文信息,如《人民日报·市场报全文数据库(1994年)》,收录了1994年《人民日报》和《市场报》的全部报道信息,共计54000篇文章,人们可以在计算机屏幕上逐页阅读,也可以通过日期、题名、版次、作者、关键词等项进行检索。

需注意的是:国内CD-ROM产品的发售渠道与计算机软件相同。检索软件是和光盘数据库一并提供的,大多数出版商已经将安装、查询、检索程序存放在同一张CD-ROM上或另外一张查询软件的CD-ROM上。

2.字段

记录中的每一个项目,如标题、作者、文摘等称为数据单元或字段,用于检索或显示。字段又可分为主题性字段和非主题性字段两种。与DIALOG联机检索系统的检索字段一致,主题性字段是描述文献内容特征,包括叙词字段(DE)、自由标引词字段(ID)、标题字段(TI)、文摘字段(AB);非主题性字段描述文献外部特征,包括著者(AU)、文献号(AN)、期刊名(JN)、分类代码(CC)等。

3.索引文档

光盘数据库还包括一些既独立又密切相关的索引文档。索引文档由基本索引文档和辅助索引文档构成,上述主题性字段和非主题性字段分别构成基本索引字段、辅助索引字段,形成基本索引文档和辅助索引文档,此两个文档均是数据库中可检词的字顺表。在这些索引中,每个词有两个数据项:一个数据项存贮该词登录的文献地址;另一个数据项是同该词有关的登录数,即赋予该标引词的文献号。

在作基本索引文档时,先将索引词按其所在字段的位置编上顺序号,然后将这些词按字顺倒排,每个词后标上字段地址及文献地址号,这样就形成了基本索引倒排档。

在编制辅助索引时,先将非主题性检索项抽出,按字段代码排列,其后跟上登录文献号。

(二)光盘数据库的结构

实际上,光盘数据库与其他计算机检索系统的结构一样,检索系统存在五种相关文档(见本书第二章):文献记录顺排文档、基本索引文档(包括基本索引词典文档、基本索引存取号倒排文档)、辅助索引文档(包括辅助索引词典文档、辅助索引存取号倒排文档)。

顺排文档是按记录号大小顺序排列的,是文献经过加工后输入计算机的原始结构。即内容陈旧的记录在前,记录号小;内容新颖的记录在后,记录号大。这种结构主要用于输出检索结果,不太适合检索。

倒排档是检索用的,即按照数据库中检索标识的某种顺序排列的文档,把检索标识抽出,跟上收录该标识的不同文献号,构成检索标识与文献号之间一对多的关系,然后将检索标识按某种顺序排列。它的形状有如顺序文档的倒排,所以称之为倒排文档。

例如,有4个词A、B、C、D包含在文献1、2、3中,其顺排档是:

1 AB

2 BACD

3 BDA

4 C

其倒排档是:

A 123

B 123

C 24

D 23

由于一个检索标识后跟随的文献号是很多的,因此倒排档的规模很大,这样既浪费计算机的存贮空间,有影响检索速度。为了便于检索,所以又设置了一个词典文档。

词典文档实际是一个索引词表,它是全部记录的标识及其在记录中地址的对照表。每检索一个主题词,首先在词典文档中找到该主题词在倒排文档中的地址,以及收录该主题词的文献号,然后到倒排档中直接调取这些记录的记录号。各文档之间的关系及检索过程可参考本书第二章。

四、光盘数据库的检索语言及检索策略

(一)光盘数据库的检索语言

光盘数据库检索语言是用来表示文献内容特征和外表特征,表达检索提问的一种语言。如各种分类表、叙词表、检索指令等都属于检索语言。检索语言应保证不同标引人员表征文献的一致性,保证检索提问和文献标引语言的一致性,保证检索要求与检索结果的一致性。

1.规范化叙词

叙词(Descriptor)是一种规范化的语言,通常由数据库的词表(如Ei OnDisc中的Thesaurus,NTIS中的INSPEC词表等)或规范化字顺表提供。这些叙词根据文献内容来选取,一般一篇文献只选取5~6个叙词,所以叙词应对文献的主题概念作深入的描述。词表中详细列出了词间的等级或属、分、参关系,选择时进行灵活组配,从而对复杂的文献概念进行合乎逻辑的标识。

2.非规范化的标引词

非规范化的标引词是标引人员在对文献进行分析标引时抽出的关键词。由于词表的缺陷,这些词未能由确切的词加以规范,而标引人员又不能用别的规范词来代替,因此将这些词也作为检索用词,存入非规范化的标引词中以供检索。在检索中,这些词不需要用词表进行规范,只要将检索词限定在非规范化的标引词字段查找即可。

3.检索指令

目前大部分光盘数据库使用的检索指令是菜单式指令语言,只有个别如KR Information OnDisc光盘数据库系统中既有菜单式语言,又有指令式语言。

①菜单式检索指令。菜单式检索只哦令主要由系统提供一些供用户不断进行挑选的菜单,指挥系统一步一步按用户要求去操作。菜单式指令是一种等级或树结构形式的指令,如图6.3-1。用户先从主菜单中选择与检索提问有关的项目,也即菜单操作的路径。然后显示第二层菜单,供用户作第二次选择,这样一步一步地选择,逐步达到所要选择的那一层菜单。

②指令式检索指令。指令式操作要求用户用一系列指令完成从检索到输出的操作。它可以提供更多的灵活性,减少熟练用户的失败和作相同处理的冗长试验。其主要缺点是要求用户必须熟悉系统的指令语言,才能有效地使用检索系统。当菜单式与指令式操作一起使用时,可使得检索操作更加方便,更能节省时间。

img48

图6.3-1

(二)光盘数据库的检索策略

1.积要木式概念组配

积木式概念组配(build block)的方法是把题目剖析成几个概念组,应首先对每个概念组进行检索,然后用逻辑概念进行组配。组配方式有:

①逐步组配。这种方法常在检索课题模糊、概念较宽的情况下使用。如图6.3-2。

概念1与概念2组配形成概念4,然后与概念3组配形成概念5。经逐步组配,概念逐步明了,命中的记录数目降低,查准率提高。

img49

图6.3-2

②对偶组配。有三个以上概念面要进行检索时采用对偶组配比较合适,其检索策略如图6.3-3。

img50

图6.3-3

先检索所有概念面,每次考虑一对概念组面相交,结果可以分别打印,也可将概念对偶组配后产生新集,然后根据需要再进行组配。

2.珍珠增长组配

积木式概念组配是从文献量多的概念面出发,通过组配逐渐减少文献量。而珍珠增长组配法则是从较精确的概念组面开始,逐渐扩大文献量。该方法的基本思路是,从与检索有关的已知文献中提取检索项构造概念面进行检索,打印命中文献的关键字段,从中选择有关概念,把新概念与原先概念相加,如此循环多次,增加检索记录。增加的项目与已存在概念组面间为OR组配。

3.族化概念组面检索策略

当检索课题相当专业化,可能查不到文献时,为了达到一定的查全率,可适当放宽检索词、用词表中表示较大概念的词来表示。这种检索策略称为族化概念组面检索。族化概念组面检索通常由具体检索要求决定,盲目使用将降低查准率。

4.引文索引检索策略

引文索引检索策略指的是通过引用和被引用著作之间关系来查找文献。检索中,引文索引检索策略相当有效。如对一些高科技、跨学科的文献进行查找,而又找不到合适的词时,只要知道所引用的某个著者、某一期刊上的文献,就可找到许多相关文献。

五、光盘数据库的检索功能及基本方法

(一)光盘数据库检索系统的检索功能

光盘检索系统的功能与指令与联机检索没有很大区别,但更方便。各个系统一般都有如下功能键:Help(帮助)、Index(索引)、History(查阅历史)、Display(显示)、Print(打印)、Select Database(选择数据库)、Format Window(格式窗)、Quit(退出)等。当然。系统一般不显示当前没有使用的功能键,只列出正在使用的功能键。

查找信息时可用单元词、多元词(短语)、数字,及布尔运算符和位置运算符把几个检索术语组配成一个提问表达式。在编制提问式时,可以用有关功能键弹出索引菜单,通过浏览各种索引获取数据库记录中的关键词、词组和系统提供的主题词表,以便于选择拼法、可能的截断术语和查找范围。当系统将检中的记录用标题形式显示出来时,用户可以用方向键在屏幕上移动至所需题名,然后以全记录形式显示或打印它。

系统保持着用户的一切提问和每一结果,因此用户可以在任何时刻回顾其查找的历史,重新使用或修改以前的任何提问。也可以在另一数据库中选择回顾历史并执行同样的检索策略,而不必重复键入或重新处理查找术语。

屏幕帮助是光盘数据库最常用也是最重要的功能之一,对计算机检索不熟悉的用户在几乎每一个重要步骤都可以得到指导。帮助的菜单内容一般是针对正在检索中的某一个步骤。其内容有:了解系统功能、提问句法、查找策略、记录字段的描述、限制符、停用词和标点、索引的使用、主题查找、从记录中抽词、截断和排列、如何显示记录、改变显示格式、打印记录、保留记录、结束查找、获得文献以及各种功能键的使用法。

(二)光盘检索的基本方法

光盘检索是采用计算机为手段,以光盘作为信息载体和检索对象进行的信息检索。其基本流程为:

根据检索的课题——选择合适的数据库——确定检索词——编写检索式——分析判断检索结果——若不合适需修改检索词和检索式——二次检索——结果输出。

1.分析研究课题,明确查找要求

明确所需信息及文献内容、性质、水平等情况;在分析课题的基础上形成主题概念;根据检索主题概念的学科性质,确定检索的学科范围。

2.选择检索数据库

由于当前文献数据库的种类繁多,各数据库的内容相差又很大,因此正确选择适当的数据库往往会起到事半功倍的效果。从国内外出版的数据库来看,一般从以下三个方面来确定数据库的内容范围。

(1)数据库的学科范围 任何数据库所收录的文献信息,总是有一定的学科范围侧重,没有一个数据库是包罗万象的,只不过大型的数据库包含的学科领域更广一点。

(2)数据库的文献范围 目前有一些数据库是以文献的类型作为收录范围的,如《国际科学技术会议录索引》(ISTP)、《世界专利索引》(WPI)、《国际学位论文文摘》(DAO)等,这些数据库都是按一定的文献类型(会议、专利、学位论文等)编制的数据库,但所涉及的学科范围非常广泛。

(3)数据库的国别或语种范围 有些数据库以国别或语种来限制收录范围,如美国专利文献数据库,中国专利数据库,中文社科报刊篇名数据库等。这类数据库往往收录的学科范围比较广,但是适合于查找某一地域的科技文献和一个国家的科技成果。

3.确定检索词

所谓检索词,就是将自己的检索要求用简洁的词语概括。检索词的选择必须符合两个要求:一是能准确反映课题的检索要求,二是必须符合数据库对输入词的要求。

不同的数据库所提供的检索途径会有所差别,因此在检索之前应了解要检索的数据库具有哪些检索途径,从而有的放矢地选择检索词。另外,同一个检索词在不同的检索字段中所检索到的结果也会很不相同。所以一定要根据检索字段的要求和课题的需要选择合适的检索词,同时也要尽可能考虑检索词的各种表达形式。

4.编写检索式

一个课题往往需要多个检索词来描述其含义,而这些检索词之间需要用一定的语法规则来规定,才能完整描述检索要求,这就是检索式的编制。包括逻辑运算符、位置运算符等。

①布尔逻辑算符。大多数光盘检索系统仍然支持逻辑与“AND”、逻辑或“OR”、逻辑非“NOT”运算,分别用来表达概念之间的交叉限制、并列、排除等关系。其运算的优先执行次序是NOT、AND、OR,可以通过加括号的形式来改变执行次序。

②位置算符。为了准确地表达某一概念或使几个检索次之间的位置关系确定,有些数据库中采用了位置算符。光盘数据库位置算符主要有三种:

W/n。用于规定两个检索词的相对位置,用此算符连接的两个检索词在结果中出现的间距为n个单词,两词前后位置不能互换。

ADJ。用此算符连接的两词必须紧挨在一起,且前后位置不能互换。这个算符比较适合于词组的检索。

NEAR/n。用于规定两个检索词的近似位置,此算符连接的两个检索词在结果中出现的间距不能超过n个单词。

③截词符。截词符主要在检索中表达同一类词(词根或词缀相同)、或不能确定某一单词中的一个或几个字母时使用,光盘检索系统通常采用的截词符是“*”、“?”。当然,不同的数据库所采用的位置算符和截词符可能会有所区别,使用时要首先察看数据库使用说明。

“*”,也称为无限截断,它可以代表词干后的几个字母,通常用于检索一类词。

“?”,也称为有限截断,它只能代表某个单词中的一个字母。例如,“thes?s”,可以检索到包含thesis和theses的文献。

5.检索结果显示及判断

根据显示文献信息的内容和篇数,可以判断检索结果是否符合要求。如果判断其结果不符合要求,则要调整检索词和检索式进行再次检索。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈