首页 理论教育 计算机信息检索的技术与方法

计算机信息检索的技术与方法

时间:2022-11-04 理论教育 版权反馈
【摘要】:计算机信息检索系统接收到正确的指令后,自动地将相关信息集合的特征标识与用户提交的检索特征进行“匹配”。用户通过显示命中记录的内容,判断检索是否成功,这就是联机信息检索技术的基本原理。③联机信息检索的服务方式。联机信息检索到的信息,大多数是一些文摘或题录形式的二次文献形式。

6.3.3 计算机信息检索的技术与方法

计算机信息检索可分为联机信息检索、光盘信息检索两类。

(1)联机信息检索

联机信息检索,是指信息用户利用检索终端设备,使用一些特定的指令和检索语词,通过通信网络与存储大量信息的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程。联机检索起源于20世纪60年代的美国;70—80年代中期,国外联机信息检索系统进入发展最快时期,许多著名的联机信息检索系统成为商业系统进入国际信息商品市场;90年代中后期,随着网络的兴起,许多大型联机信息检索服务机构纷纷加入互联网,提供网上检索。

联机信息检索允许用户以联机会话的方式直接访问系统及其数据库,检索是实时、在线进行的,并在检索过程中可随时调整检索策略。这种系统具有分时的操作能力,能够支持许多相互独立的终端同时进行检索,用户的提问一旦传到主机被接收后,计算机能及时处理、即刻回答,将检索结果很快传送到用户终端,用户可以浏览所得到的信息,随时修改提问,直至得到满意的结果。

联机信息检索系统的优点是:①检索速度快;②检索范围广而全面;③检索途径多、质量高;④检索内容新、实时性强;⑤检索辅助功能完善、使用方便,检索结果输出方式灵活、实用。但是,联机信息检索也存在着自身的缺陷:①主机负担重,一旦出现故障,则整个网络都将瘫痪;②信息组织方式以线性为主,不够灵活;③联机检索不像Internet是面向最终用户的,操作也没有后者方便。因此,在Internet网络信息检索的冲击下,传统联机信息检索业纷纷采取改进措施,将自己的系统安装在Internet服务器上,成为Internet的一个有机组成部分。如DIALOG、American Online等世界著名联机系统都建立了自己的WWW服务器,使用超文本技术,增加服务项目,改善用户界面。

①联机信息检索系统的结构。联机信息检索系统由检索服务机构、国际通信网络及检索终端三部分构成。

第一部分是检索服务机构。它由中央主机、数据库及其他外部设备组成。中央主机是检索系统的主体部分。它的主要功能是进行信息的存储、处理、检索以及整个系统的运行和管理。一般联机系统拥有多台中央主机,可以随时切换,以保证检索的正常进行。数据库是存储在磁带或磁盘上的文献或数据记录的集合,是联机检索的对象,它相当于手工检索的检索工具书,其实有些数据库就是手工检索工具的机读版。因此,掌握各种数据库的性能是联机检索的前提。其他外部设备,主要有主机操作台、高速打印机等设备,用以解答用户在检索过程中提出的各种问题,处理用户脱机打印要求。

第二部分是国际通信网络。它由通信线路、调制解调器、自动呼叫应答器、多路复用器、通信控制器组成。

第三部分是检索终端。检索终端是用户向联机检索服务机构发送或接收信息的必要设备,主要由终端、调制解调器和打印机组成,其中终端是最主要的组成部分。用户采用各厂商生产的PC机作为终端,利用键盘输入检索指令,也可预先存入计算机,待接入联机系统后由计算机直接发送,系统对检索指令的响应显示到显示器上。

②联机信息检索的技术原理。联机信息检索系统是一个典型的计算机信息系统,能完成数据收集、分析、加工处理、存储、传递通信和检索信息的全过程。在信息存储的过程中,由系统按一定的规律对信息进行加工处理,并赋予特征标识。在信息检索的过程中,由用户通过系统提供的检索指令,向系统提交含有需求特征的检索表达式。计算机信息检索系统接收到正确的指令后,自动地将相关信息集合的特征标识与用户提交的检索特征进行“匹配”。这种“匹配”完全是一种字符串的类比运算。匹配结束,系统自动给出存储信息的特征与检索提问的特征相符的记录篇数,即命中数量。用户通过显示命中记录的内容,判断检索是否成功,这就是联机信息检索技术的基本原理。

③联机信息检索的服务方式。联机信息检索的服务方式主要有以下几种:

a)定题信息提供(Selective Dissemination of Information,SDI)。这种服务是由检索系统工作人员将用户信息需求转换成一定的检索提问式,并将此式存入计算机中,信息检索系统定期从新的文献信息中为用户检索,并按用户指定的格式为用户加以编排和打印。利用SDI服务,用户可定期获得所需要的最新信息,及时掌握同类专题的动态和进展。

b)专题回溯检索(Retrospective Search,RS)。这是用户对检索系统中积累多年文献资料的数据库进行检索,查找一定时间范围以内或特定时间以前的文献,通常采用联机检索方式进行。这种服务可以使用户一次检索全面了解某一课题在某一段时间中的发展情况,对申请专利、课题开题、某一科研项目鉴定撰写综合性论文编制教材等非常有用。

c)联机订购原文。联机信息检索到的信息,大多数是一些文摘或题录形式的二次文献形式。用户如果需要原始文献而在本地馆藏中又无法查到时,可以通过联机终端向联机服务系统订购文献原文,信息检索系统自动将用户的订购要求输送到用户选定的数据库文献提供者处,数据库文献提供者将用户所需的文献传送给用户。

d)电子邮件。联机系统开展此项业务,以满足用户与系统之间、用户与各机构之间、用户与用户之间发送、接收、存储各种信息的需要。每个系统用户都拥有一个E-mail号码,联网系统有参加电子邮政用户的名单。输入接收者的E-mail号码和通信内容,接收者过去需要耗时几天才能接收到的信件现在只用数秒钟就可以完成。

(2)光盘信息检索

光盘是继纸张、缩微胶片、磁存储器之后的一种用激光束记录和再现信息的存储载体。用于检索和阅读的光盘通常为只读光盘(Compact Disc-Read Only Memory,CD-ROM)。它是一种信息载体,而要对其中的信息进行检索和利用则需要计算机的配合。光盘产品自20世纪70年代出现以来,最初只用于娱乐,直到1985年人们才研制出第一种专用于信息服务的光盘。此后,以光盘为载体的数据库产品层出不穷,为信息产业的发展注入了新的生命力,特别是光盘与计算机的结合,使得信息检索模式发生了革命性的变化。

①光盘信息检索特点。

a)使用光盘检索系统,可免除联机检索系统所必须使用的电信设备,节省了电信费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误;

b)光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并提供菜单驱动与命令驱动两种方式;

c)光盘存储容量大、耐用、复制费用低;

d)可以把文本、图形、图像、声音及动态形象结合在一起;

e)如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘数据库,又要受到经费限制;

f)在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只能定期提供;

g)数据库费用大。

②光盘信息检索技术。光盘信息检索系统由计算机、驱动器及连接设备、CD-ROM数据库(光盘)及其检索软件构成。

使用CD-ROM光盘需要在计算机上装配CD-ROM驱动器,驱动器可安装在绝大多数计算机上。驱动器是读取光盘数据的专用设备,在计算机扩展槽上插入CD-ROM驱动器的接口卡就可将计算机与驱动器连成一体。CDROM驱动器有内置式和外置式两种,前者装在计算机机箱内,可节省台面空间,价格较便宜;后者可很方便地移动到不同的计算机上。选择驱动器时主要考虑以下性能:a)速度,一般在185~500ms;b)查找速度,一般在250~400ms;c)数据缓冲区越大,可直接从存储器存取的数据就越多,节省查询时间;d)数据传送速度,有单速、双速乃至50倍速以上的驱动器。

③光盘信息检索方法。光盘检索系统的功能和指令与联机检索没有很大区别,但更方便。各个系统一般都有如下功能键:Help(帮助)、Index(索引)、History(查阅历史)、Display(显示)、Print(打印)、Select Data-base(选择数据库)、FormatWindow(格式窗)、Quit(退出)等。当然,系统一般不显示当前没有使用的功能键,只列出正在使用的功能键,全部功能键及用法可以在附录中查找。

检索信息时可用单元词、多元词(短语)、数字及布尔运算符和位置运算符把几个检索术语组配成一个提问逻辑式。在编制提问式时,可以用有关功能键弹出索引菜单,通过浏览各种索引获取数据库记录中的关键词、词组和系统提供的主题词表,以便选择拼法、可能的截断术语和查找范围。当系统将中检的记录用标题形式显示出来时,用户可以用方向键在屏幕上移动至所需题名,然后以全记录形式显示或打印它。

系统保持着用户的一切提问和每一结果,因此用户可以在任何时刻回顾其查找的历史,重新使用或修改以前的任何提问,也可以在另一数据库中选择回顾历史并执行同样的检索策略,而不必重复键入或重新处理检索术语。

屏幕帮助是光盘数据库最常用也是重要的功能之一,对计算机检索不熟悉的用户在几乎每一个重要步骤都可以得到指导。帮助的菜单内容一般是针对正在检索中的某一个步骤。其内容有了解系统功能、提问句法、检索策略、记录字段的描述、限制符、停用词和标点、索引的使用、主题查找、从记录中抽词、截断和排列、如何显示记录、改变显示格式、打印记录、保留记录、结束查找、获得文献以及各种功能键的使用法。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈