首页 百科知识 信息检索发展的历史及模式的演变

信息检索发展的历史及模式的演变

时间:2022-09-30 百科知识 版权反馈
【摘要】:信息检索经历了手工检索、机械检索、脱机批处理检索、联机检索和网络信息检索五个阶段。20世纪中期以来,计算机技术在信息检索领域的应用不断取得突破,计算机信息检索经历了脱机批处理检索、联机检索、网络信息检索等主要阶段。脱机检索方式适用于面向科技人员的定题服务。联机检索是在远程终端设备上借助通信线路与远距离数据库系统的一种问答式检索。

第二节 信息检索发展的历史及模式的演变

信息检索经历了手工检索、机械检索、脱机批处理检索、联机检索和网络信息检索五个阶段。早期的信息检索主要依靠信息分类,但是随着文献量的增加和文献类型的多样化,单纯依靠分类难以解决快速查找文献信息的需要,因此,出现了能基于某一线索深度揭示某一具体内容的工具————索引,以及能在一定程度上浓缩和揭示文献内容的工具————文摘。目录、索引和文摘等书目型检索工具成为手工检索时期查找印刷型文献最基本的工具。

机械检索开始于20世纪50年代,它采用各种机械工具和设备进行检索,是手工检索向计算机信息检索的过渡。

20世纪中期以来,计算机技术在信息检索领域的应用不断取得突破,计算机信息检索经历了脱机批处理检索、联机检索、网络信息检索等主要阶段。计算机具有强大的信息存储与信息处理能力,与手工检索相比,计算机信息检索具有检索速度快、检索途径多、检索范围广、检全率高等优点。

一、手工检索(19世纪70年代—20世纪40年代)

信息检索活动起源于图书馆参考咨询工作和文摘索引工作。从19世纪下半叶开始发展至20世纪初,信息检索逐渐成为图书馆的一项独立的用户服务工作。1876年,美国图书馆协会(American Library Association,ALA)成立并召开了第一届大会,马萨诸塞州伍斯特(Worcester)公共图书馆员塞缪尔·格林(Samuel S. Green)在会上首次提出了开展参考咨询服务的建议。1883年,美国波士顿公共图书馆设立了第一个专职参考咨询职位————参考馆员,并设立了参考阅览室,从此,作为信息检索起源的参考咨询工作成为图书馆的一项正式业务而得到发展。20世纪初,绝大多数图书馆都成立了参考咨询部门,其服务内容包括:利用图书馆的书目工具帮助读者查找图书、期刊,进行文献分析与翻译等。

在手工检索时期,独立性的文摘性刊物出现并得到发展,索引也成为独立的检索工具,而索引与文摘的结合使用,使各种手工检索工具的查询功能得到提高。在这一时期,出现了一批高质量的文摘和独立索引等大型检索工具,包括:美国工程信息公司编辑出版的《工程索引》(Engineering Index,EI)(1884年),英国电气工程师协会编辑出版的《科学文摘》(Science Abstract,SA)(1898年),美国化学文摘社编辑出版的《化学文摘》(Chemi-cal Abstract,CA)(1907年),美国生物科学信息社编辑出版的《生物学文摘》(Biological Abstract,BA)(1926年),美国科学信息服务社编辑出版的《科学引文索引》(Science Citation Index,SCI)(1961年),等等。上述学术性的文摘和索引工具为各国科研人员提供了重要的文献信息源和检索服务。

手工检索的特点是:以印刷型文献为主要检索对象,以各类题录、索引、文摘等书目型工具为主要检索工具,以图书馆的参考咨询部门为检索服务的主要机构。手工检索操作简单,费用低廉,但检索效率很低。随着文献信息量和信息类型的增加,计算机信息检索技术的迅速发展,传统的利用印刷型文献进行手工检索的方式逐渐退出了检索的主流。

二、机械检索(20世纪40—50年代)

20世纪50年代,机械检索开始得到使用。1954年,现代情报学创始人美国的万尼瓦尔·布什(Vannevar Bush)博士在其论文As We may Think中首次提出了设计自动的、在大规模存储数据中进行查找的机器的设想,他与美国农业部图书馆馆员拉尔夫·肖共同制造了一台快速检索机————布什·肖检索机。它利用光电原理,对缩微复制在胶卷上的文献信息进行检索。

机械检索的原理是,通过设计和制作特定的机械装置,改进信息的存储和检索方式,通过控制机械动作,借助机械信息处理机的数据识别功能部分地替代人脑,在一定程度上实现了信息检索的自动化。但它只是采用单一的方法对固定的存储形式进行检索,成本高,检索复杂,检索效率不甚理想。机械检索系统很快被计算机情报检索系统所取代。

三、脱机批处理检索(20世纪50—60年代)

1946年世界上第一台计算机问世,20世纪50年代,计算机技术开始在书目情报检索领域得到应用,1954年,美国海军军械实验中心利用IBM701机将4000篇技术报告进行了计算机存储与检索的实验,建立了世界上第一个计算机文献情报检索系统。20世纪40—60年代,在计算机应用领域“穿孔卡片”和“穿孔纸带”数据录入技术及设备相继得到应用,以它们作为存储文摘、检索词和查询提问式的媒介,使得计算机开始在文献检索领域中得到了应用,20世纪70年代之后,“穿孔卡片”和“穿孔纸带”被磁性媒介(磁带等)所代替。

计算机应用于信息检索的早期阶段主要以脱机检索方式为主。脱机检索利用单机的输入和输出装置,用磁带作为媒介进行检索。以脱机方式检索,计算机只能顺序检索磁带上记录的信息,每检索一次都必须从头到尾读一遍磁带,因此,一般采用批处理方式实施检索。脱机批处理检索的具体表现为:输入计算机的待检文献信息(文献题录、文摘等)存储在磁带上,检索提问则存储在穿孔纸带或穿孔卡片上,其特点是不对一个检索提问立即作出回答,而是集中大批提问后再进行处理。即由检索人员集中一批用户的检索提问,预先编制检索策略,存储在计算机检索系统中,定期地检索数据库中新增加的内容,然后把命中的文献信息分发给各个用户。脱机检索过程中,人机不能直接交互、对话,处理的周期较长,因此,检索效率往往不够理想。脱机检索方式适用于面向科技人员的定题服务。定题服务是登记用户提问并存入计算机中形成一个提问档,每当新的数据进入数据库时,就对这批数据进行处理,将符合用户提问的最新文献提交给用户,可使用户随时了解课题的进展情况。

四、联机检索(20世纪60—90年代)

联机检索是在远程终端设备上借助通信线路与远距离数据库系统的一种问答式检索。联机检索产生于20世纪60年代中期到70年代初,由于计算机分时技术的发展,通信技术的改进,以及计算机网络的初步形成和检索软件包的建立,用户可以通过检索终端设备与检索系统中心计算机直接进行人机对话,从而对远距离之外的数据库进行检索。

1965年,美国系统发展公司(SDC)研制成功了联机检索软件————书目情报分时联机检索(Online Retrieval of Bibliographic Information Time Shared,ORBIT),标志着联机检索的诞生。1966年,美国洛克希德导弹与宇航公司研制了世界上第一个人机对话的信息检索系统————DIALOG系统,开始了联机文献情报检索。此后,其他大型联机检索系统如BRS系统(存储和信息检索系统)、欧洲的ESA-IRS系统(欧洲航天局信息检索系统)等都开始研制并逐步发展起来。

20世纪70年代开始,联机检索由实验转向商业化运营,对社会公众提供服务。20世纪80年代,随着空间技术的发展,信息检索进入了国际联机检索的新时期。国际联机信息检索是指商业性的联机数据库检索服务机构通过国际(卫星)通信网络,为世界各地的用户终端提供人机对话式的检索服务方式;用户利用计算机终端设备,通过国际(卫星)通信网络,与世界上的大型计算机检索系统的主机联结,从而能检索世界范围内各个计算机检索系统的信息资源。国际联机信息检索使信息检索超出了一个国家和地区的范围,促进了全球信息资源的共享。

在此期间,出现了光盘检索。与国际联机检索相比,光盘检索不需要支付国际通信费,具有方便、易操作、费用低、寿命长,以及其海量存储可实现原文检索等优点,因此在我国十分普及。但光盘数据库更新速度慢,不能完全取代国际联机检索。

五、网络信息检索(20世纪90年代—至今)

网络信息检索是在国际联机检索和光盘检索基础上发展起来的,通过Internet对远程计算机上的信息进行的检索。20世纪90年代,随着卫星通信、光纤通信等现代通信技术以及信息高速公路等网络基础设施的迅速发展,基于Web的网络信息检索开始出现并得到迅猛发展。在这一时期,因特网资源爆炸式增长,网络搜索引擎技术的发展应用令人瞩目,同时,传统的联机检索系统如Dialog及各类数据库检索系统的信息服务也逐渐建立了Web服务平台,面向互联网终端的用户提供服务。

Internet技术发端于20世纪60年代,在经历了早期的军事、科技与教育等专门领域的试验和应用之后,于20世纪80年代末开始在全球范围内飞速发展。文件传输(FTP)、远程登录(Telnet)、电子邮件(E-mail)成为当时Internet上广泛使用的三大基本服务。进入90年代,WWW(“World Wide Web”,又称为“Web”、“3W”)在Internet上获得迅猛发展,它所支持的超文本技术和浏览器技术能够使用户获取联入Internet的世界上任何一台计算机上的文本、图形、声音以及视频等各类信息,WWW信息检索迅速取代了FTP和Telnet,成为主流的技术应用平台。

随着因特网资源的增长,搜索引擎技术产生并不断创新。1994年4月,美国斯坦福大学的两名博士生David Filo和美籍华人杨致远创办了网络资源目录Yahoo!,同年7月,具有现代意义的机器搜索引擎Lycos诞生。搜索引擎技术从此进入了高速发展时期。搜索引擎分为两类:①以Yahoo!为代表的目录式搜索引擎,主要采用人工方式搜集网络信息,进行分类整理,并以分类目录浏览的方式提供服务;②以Lycos、AltaVista、Excite等为代表的机器人搜索引擎则通过特定的搜索软件对Web信息进行搜索,建立索引文档,为用户提供关键词查询服务,具有自动化程度高、收录范围广、功能强大的优势。由于目录式搜索引擎成本高、更新不及时、数据量有限,逐渐被具有现代意义的机器人搜索引擎所超越。

在信息检索由手工检索、机械检索、单机检索、联机检索向网络信息检索的发展过程中,信息检索模式也随之发生着演变,即由传统文献信息检索的“提问—检索”模式,转向以Internet为基础的“浏览—查询”模式。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈