首页 理论教育 信息检索的基本原理的分析介绍

信息检索的基本原理的分析介绍

时间:2022-11-04 理论教育 版权反馈
【摘要】:我们可以把信息检索的基本原理概括为:对信息资源集合与信息需求集合的匹配与选择。用户信息需求的产生及其满足,是实施信息检索行为的前提与基础,更是实施信息检索行为的目的所在。这就是要求信息检索提供一种“匹配”机制。在信息资源集合与信息需求集合都进行了特征化表示的基础上,它们两者之间的匹配就简化为提问式与已建立的有序的索引库之间的匹配,即两组有限的语词符号化特征之间的匹配比较。

6.1.3 信息检索的基本原理[3][4]

现实生活中,用户的信息需求千差万别,获取信息的方式与途径也各种各样,但如果仔细分析基于不同信息检索设施或工具的检索处理过程,其基本原理却是相同的。我们可以把信息检索的基本原理概括为:对信息资源集合与信息需求集合的匹配与选择(如图6-2所示)。

img177

图6-2 信息检索的基本原理

(1)信息资源集合

信息资源集合是指有关某一领域的、经选择性采集和组织加工的信息集合体。为了保障信息检索的快速与高效,需要对信息资源集合进行某种形式化的加工,形成它们的特征化表示,即对它们进行分析与标引,让原来隐含的、不易识别的特征显性化,并获得相应的标识(如分类号主题词等)。将这些被分析、提取出来的特征及其标识进行存储,便构成了索引库,成为组织和查找信息资源的依据和标准。

(2)信息需求集合

用户的信息需求是在社会实践活动中产生的。当人们为完成某一任务或工作时,时常会觉得缺少某些知识,这就产生了信息需求。众多用户不同形态的信息需求的汇集,形成了信息需求集合。用户信息需求的产生及其满足,是实施信息检索行为的前提与基础,更是实施信息检索行为的目的所在。如同对信息资源集合进行的特征化表示一样,对用户提出的信息需求也需要进行类似的加工处理,即分析需求的内容,提取出主题概念或其他属性,并利用与信息资源集合相同的标识系统(即检索语言)来表示需求中所包含的概念和属性,从而得到用户需求的特征化表示结果——提问式(Query)。

(3)匹配与选择

面对信息资源集合与信息需求集合,如何在两者之间建立起联系与沟通的桥梁,以便能从信息资源集合中快速获取用户所需要的信息与知识呢?这就是要求信息检索提供一种“匹配”(matching)机制。这种机制的主要功能在于:能够把信息需求集合与信息资源集合依据某种相似性标准进行比较与判断,进而选择出符合用户需要的信息。在信息资源集合与信息需求集合都进行了特征化表示的基础上,它们两者之间的匹配就简化为提问式(代表用户的信息需求集合)与已建立的有序的索引库(代表信息资源集合)之间的匹配,即两组有限的语词符号化特征之间的匹配比较。这种简化对于提高匹配和选择的效率来说是非常必要的,但同时它也带来了一些问题,例如漏检、误检等。如何减少这类问题,成为信息检索领域中一个备受关注的研究课题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈