首页 理论教育 信息检索的类型与特性的分析介绍

信息检索的类型与特性的分析介绍

时间:2022-11-04 理论教育 版权反馈
【摘要】:它是指以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。主要针对各种数字化音频与视频信息而进行查询的一类新型的信息检索操作。查全率与查准率往往是成反比的。上述两种不确定性作用于检索系统,使得信息检索具有不确定性。所谓检索策略是指处理信息检索提问的逻辑与查找步骤的科学安排。

6.1.2 信息检索的类型与特性

用户的信息需求多种多样,信息检索技术也在不断发展变化,信息检索的类型可从不同的角度划分。

(1)按存储和检索的内容划分

①文献检索。它是指以文献(包括文摘、题录或全文)为检索对象的一类信息查询活动。例如,为了撰写综述性论文,某作者需要对论述相关问题的大量文献进行搜集和阅读;为了审查某项专利发明的新颖性和先进性,审查员需要查阅有关的专利说明书及其他资料;等等。

数据检索。检索系统中存储的是数值型数据,如科学技术常数、各种统计数据、人口数据、气象数据、市场行情数据、企业财政数据等。检索系统通过一定的运算推导能力反馈给用户经过核实、整理或加工过的数值信息。

③事实检索。检索系统中存储的是从原始文献中抽取的关于某一事物(事件、事实)发生的时间、地点和过程(情况)等方面的信息。它是数值信息和系统数据信息的混合。一般需从系统中检索出所需信息后,再加以逻辑推理给出结论。

随着信息处理技术的不断发展,目前信息检索的对象大大丰富,除了文献、数据、事实等对象之外,图形、图像、音频、视频等新型媒体信息急剧增加,并逐渐被纳入信息检索的研究视野。当前,根据检索内容,信息检索类型出现了一种新的三分方法,即:文本检索、数值检索、音频与视频检索。

①文本检索。它是指以各种自然语言符号系统所表示的信息作为主要检索对象的信息检索活动。文本检索是传统(文献)检索方式的延续,目前在信息检索领域仍占据主要地位并不断得到新的发展,例如:从早期的结构化书目信息检索到当前的无结构或半结构化的自由文本检索;从关键词检索到概念检索甚至语义检索,等等。

②数值检索。主要针对数值型数据的查询而发展起来的一类较有特色的信息检索活动。数值检索不仅能检索出符合特定需求的数据信息,而且还可以在此基础上提供一定的数据运算与推导能力,以及制表、绘图功能。由于数值信息的不断丰富和在某些专业领域(例如财经、金融、统计等)广泛而重要的应用,自20世纪70年代起,数值检索逐步获得了独立发展的空间。

③音频与视频检索。主要针对各种数字化音频与视频信息而进行查询的一类新型的信息检索操作。我们所常用的搜索引擎当中,在网页搜索的基础上,音频、视频搜索也逐渐成为搜索的主要对象。

(2)按检索系统中信息的组织方式划分

①全文检索。对检索系统中存储的整篇文章乃至整本书按照自己的需要获取有关的章、段、句、节等信息,还可以进行各种频率统计和内容分析。

②多媒体检索。查找含有特定信息的多媒体文献的检索,其结果是以多媒体形式反映特定信息的文献或片断,如图形、图像、声音、动画、影片等。

超媒体检索。包括对超文本和多媒体进行的检索。系统中存储的对象不仅有文本,还有图形、图像、声音、视频等多媒体信息。这些信息在组织结构上以超级链接的方式存在,因而检索的结果是逻辑连接链(links)。这种链一般是多维的。

此外,还可以按照检索要求来区分为强相关检索和弱相关检索。前者强调的是查准率,后者强调的是查全率。查全率与查准率往往是成反比的。按照检索性质可分为定题检索和回溯检索。前者是查找有关特定主题最新信息的检索,又称为SDI检索,后者是查找一段时期内有关特定主题信息的检索,也称为追溯检索。按照检索方式可分为手工信息检索、机械信息检索和计算机信息检索。

无论是哪一种检索类型,信息检索都满足如下特性:

(1)信息检索的相关性

前苏联情报学家切尔内认为:所谓相关性,是指信息检索时规定的一篇正文与表示信息提问的另一篇正文的符合程度[1]。福斯克特把相关性定义为:属于不拘于提问词的论文方面/主题领域的并由该领域的人们一致确认的文献。国内信息界认为:相关性表明用户是否认为一文献与一提问吻合。在信息检索中广泛地存在着相关性的问题[2]

(2)信息检索的不确定性

信息检索系统并没有直接处理原始信息和原始用户需求,它提供的只是信息表示和查询表示之间的关系,这就涉及标引和检索词选用的准确度问题。而实际上,在标引和检索词的选用中都存在不确定性。标引的不确定性是指不同标引员在给同一篇信息对象进行标引时会选用不同的标引词,即标引词选用的不一致性。检索词选用的不确定性是指候选检索词集不止一个,而是多个,检索过程具有试探性:系统依次选用词集进行检索,直到检出或在失败中放弃查找。上述两种不确定性作用于检索系统,使得信息检索具有不确定性。

(3)信息检索的逻辑性

信息检索作为信息管理的核心,具有非常强的逻辑性。在检索语言方面,检索词表作为检索语言的典据性文本,其自身编排具有很强的逻辑性。在检索策略的研究方面逻辑性表现得更为明显。所谓检索策略是指处理信息检索提问的逻辑与查找步骤的科学安排。正确的检索策略优化了检索过程,有助于取得最佳的检索效果,获得具有高相关度的文献。但是如前面所分析的,检索过程具有不确定性,这一点决定了检索不是一个一蹴而就的过程。在检索过程中能否根据实际情况进行动态的反馈和调节以尽量减少检索失误,直接影响到检索的成败。其中系统与用户之间交互的接口功能与检索策略的逻辑性更为关键。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈