基于认知理论的知识检索模型

时间：2023-03-04 理论教育版权反馈

【摘要】：以认知观的视角可将信息检索的研究方法及研究模型分为:系统导向的信息检索和认知与用户导向的信息检索。基于认知理论和认知模型，可以把信息检索空间看作一个整体的认知空间。认知内容的内在结构与其功能表现是相统一的。有关认知环境的语义信息的集合称为认知情境。基于认知观的知识检索模型，应包括五大认知要素:认知行为者、检索机制、

5.2.4　基于认知理论的知识检索模型

1.认知理论与知识检索

认知科学通过研究人类感知和思维信息处理过程，从而探索人类、机器的智能本质和规律。其研究内容包括知觉、学习、记忆、推理、语言理解、知识获取、意愿、情感等统称为意识的高级心理现象，也就是涉及从感觉输入到复杂问题求解，从人类个体到人类社会的智能活动，以及人类智能和机器智能的性质等多方面。它可以被定义为研究人(动物)、计算机或抽象形式的智能及其计算过程的科学。

认知科学通过多种不同的途径和模型对智能进行研究，如通过构建关于智能过程的抽象化模型(即认知模型)来研究智能;通过研究人和动物的智能行为来抽象关于智能过程的理论;通过研究计算机智能程序的组织和行为来探讨智能计算的原则等。

认知模型是描述人的认知过程，也就是描述人的信息获取、存储、处理及输出等过程的理论模型。根据不同的目的、从不同的角度，对人的认知过程进行研究，可以构建各种不同形式、不同目的的认知模型，如行为层次模型、认知风格模型、认知协作模型和认知动态模型等。

以认知观的视角可将信息检索的研究方法及研究模型分为:系统导向的信息检索和认知与用户导向的信息检索。系统导向的信息检索，以面向应用领域的社会建构主义理论为基础，侧重研究检索系统的硬、软件要素及其关联，较少考虑人尤其是用户的作用。认知与用户导向的信息检索，以人为本，以认知行为者(特别是用户)为中心，以整体主义的认知观作为检索认知框架的重要理论基础，充分模拟和应用人类的认知模型、认知行为、认知情景等认知信息及其关联。认知行为者可以是用户、作者、系统设计与管理者、信息管理专家等。

在知识检索过程中，认知模型能够充分捕捉用户提问所处的认知环境中的各种认知信息，并对这些分布的、动态的、复杂的隐含信息进行挖掘，使其显性化、形式化，聚造真实、形象、全面的用户情景，从而能够充分挖掘用户需求的语义内容，构建合理的检索策略。

基于认知理论和认知模型，可以把信息检索空间看作一个整体的认知空间。该空间是在整合各类认知行为者的认知结构的基础上构建的多维空间，而维具有层次特性。这些维度反映了不同的逻辑视角，支持不同的检索模型。

检索认知空间包括认知行为、认知内容、认知环境三个基本认知维度。

(1)认知行为的维度

认知可以说是对问题求解的行为或操作的反映。人的认知行为有很多种，主要包括知觉、思维、记忆、语言、学习、理解、推理、识别等。人类认知在行为角度上，不仅呈现的是层次递进式的实施程序，按照认知进展次序，依次为知觉、观察、解释、理解、反应等阶段，而且还是一种分布性极强的行为状态。在此过程中，人类潜在的认知能够被逐步表现或转化为显式的认知形式，从而可以对其进行有效的分析与应用。

在认知与用户导向的检索模型中要研究所有认知行为者的认知行为，包括感知行为、信息与知识处理行为、检索行为、交互行为、用户行为等，特别重视用户的认知行为的研究和应用。

用户的认知行为是其在信息搜索过程中，针对搜索任务所表现出来的所有行为。概括起来包括形体动作(如眼神、手势等)、识别反馈(如对结果的反应)、路径选择(如在兴趣激发下的推理扩展)等。用户的认知行为具有很强的个性。对于同一个信息需求，不同用户的认知行为肯定不一致，甚至是截然相反，而且同一用户对于同一需求，在不同的时空下也会有不同的认知行为表现。这主要是用户认知行为存在着很多影响因素。

(2)认知内容的维度

认知内容的内在结构与其功能表现是相统一的。认知产生于需要认知的对象——客观世界和具有认知能力的主体——人。因此认知在内容上，主要表现为认知主体、认知对象、认知过程的结构、属性和功能，包括认知内容的构建以及对认知相关信息符号的处理、加工和控制。

认知空间中的信息与知识内容，可以应用多种和多元表示方法，将其抽象为类型多样的概念及其概念关联、知识元素及其关联。而本体论本身就可以被看成概念及关联所构成的集合。因此，从认知内容的角度，可以将知识检索对象以本体的表现形式加以组织构建。

(3)认知情境的维度

无论从生物学的层面来分析还是从人类社会科学的角度来分析，认知表达的都是人与环境之间的因果关系。虽然认知主体本身具有自我抉择能力，认知环境对认知主体的影响力却是不可忽略的。认知环境大致可以分为历史环境(指认知主体所处的社会、文化环境，以及以往通过经验学习积累的知识结构等)和应用问题环境(指问题求解过程中所涉及的来自认知主体内部与外界的、与相应问题相关的方方面面)。

有关认知环境的语义信息的集合称为认知情境。在知识检索中，每一个检索任务都处于一种独特的认知情境之中，受到周围各种因素的影响，其中包括认知模型、领域知识、检索策略与方法等。同时还会受到检索任务之间的相互影响，以及任务所涉及的检索主体和检索客体的影响。

情境大体上可以分为内部情境(Internal Context)和外部情境(External Context)。内部情境描述的是内部资源和用户的状态，包括工作情境(如现时计划和它们的状况等)、个人活动(如用户经历的通过外部事件内在化而形成的事件)、通信情境(如人们之间通信的状态)，以及用户的情绪等。外部情境描述的是环境的状态，包括地点、同其他对象(人和系统)在时空上的关联，以及时间情境等。内部情境比外部情境更难感知，在某种情况下需要通过外部信息的推理获取。由于存在这些困难，内部情境在当前的信息检索研究中似乎更容易被人们回避。但是，无论是内部情境还是外部情境，当用户进行关于信息需求输入的时候，都会起到很重要的补充作用。

在信息检索中，情境有助于对用户需求、检索过程、结果处理等进行全面分析与评价。例如，情境在语言和沟通上能够消除意义模棱两可的情况，有利于分析和确定用户需求主题，辅助构造和描绘人们的信息需求和信息行为，使信息检索在环境、认知和情感层面上与用户需求相关。

认知的行为维度、内容维度、环境维度其实都不同程度地、从不同角度反映出人类认知的分布特性，并在此基础上体现出一种整体协作的思想。行为维度顺应了人类认知的自然分布状况，认知信息通过分布式获取、集成来构成整体认知模式;内容维度体现了各类信息对象的分布性及其内容的整体性;环境维度强调和利用的是在分布条件下，任何事物都在整体环境中具有不同程度的相关性。

2.基于多维认知的知识检索模型

基于认知观的知识检索模型，应包括五大认知要素:认知行为者、检索机制、信息对象、交互界面和检索情景^［2］。模型能正确处理要素之间的认知关联，包括知识关联、检索交互、调控与协作等，并将检索行为者的认知因素置于重要的位置。

从检索认知空间中不同的认知维度出发，可以构建不同的认知检索模型。但是，认知的各维度之间虽然存在角度的不同，但不是绝对孤立的，而是在实际应用中相互影响、相互支持的。因此，从整体认知观出发，应考虑多个认知维度，构建知识检索模型，这样才能从部件到综合、从关联到整体，共同通过对检索主体、检索客体、检索过程的交互、调控与协作，达到较理想的检索效果。

这里将以VICODI语义检索系统模型为例，介绍基于多维认知的知识检索模型。该系统强调检索情境在语义检索系统中的重要作用，通过对用户认知行为的获取，利用用户情境的形式辅助整个检索过程的运行，并以领域本体作为进行用户检索提问启发式扩展所需语义知识的主要来源，在认知内容维度上发挥其优势作用。

数字内容的可视情境化(the Visual Contextualization of Digital Content，VICODI)计划是来自欧盟六个国家的七个合作机构共同研究的，主要以欧洲历史学科领域作为研究对象。其目的是要通过利用对数字资源的半自动化情境处理，从而提高互联网上人们对数字内容的理解。比如，将构造的语义元数据放置在某一情境中，而这里的语义元数据有两个目的:一是便于理解信息资源中蕴涵的内容;一是便于对这些信息资源实施检索。

该研究计划的关键思想与技术主要是:

●将用户融入到整个检索系统中来，保存他在检索过程中的每一步骤所进行的点击以及留下的检索轨迹等信息，作为组织用户知识的基础。

●强调整个检索过程的情境化，并允许用户浏览系统中的有关情境，如可以利用信息资源情境信息来扩展、完善和确认自己的需求，明确其检索目标，发现潜在目标资源。同时，系统也不断修正、重构该用户情境，使其能更全面、可靠、准确地描述用户需求，以及对其检索结果进行精练。

●提供情境导航支持，构造了具有导航要素的用户情境，从而利用其提高检索效率。

(1)VICODI系统模型

VICODI系统模型主要包括以下五个模块(图5-5)。

图5-5　VICODI系统的框架图^［3］

①知识空间管理系统(Management System of Knowledge Space，MSKS)。这一模块主要包括本体管理机制、资源管理、检索服务和接口。VICODI应用开放式本体框架KAON管理欧洲历史领域本体和通用性知识本体，包括本体实例、概念/子概念、特征关系实例等的识别、分析、描述、编辑和维护。知识资源管理包括知识获取、编制本体词表、建立知识评估机制、构建知识库等，支持本体、元数据、情境等有关知识内容的集成管理。本模块提供文本资源的检索和本体实例的检索。MSKS接口与Web应用连接。

②情境引擎(Contextualisation Engine，CE)。CE模块的任务之一就是针对新提交给系统的信息资源，自动进行情境描述、情景评估、情景过滤等处理。另一任务就是利用各种计算情境相似度的方法支持情境检索。

③转换引擎(Transformation Engine，TE)。该模块的第一个功能是实现文本转换，其目的是为了情境的可视化显示，其主要工作包括通过本体实例匹配从文本中推导实例，并保存超链接和情景链接。另一个功能是机器翻译(Machine Translation，MT)，利用Systran公司的机器翻译服务器通过远程服务接入系统，可以对多种语言进行HTML/XML片段的翻译，目前实现了英语、法语、德语的翻译。

④图用户接口(Graphic User Interface，GUI)。它是VICODI系统的用户界面，使用向量图(Scalable Vector Graphics，SVG)方法，提供情景信息(位置、时间、主题)的可视化显示和浏览，便于用户理解数据。

⑤网络用户接口。该模块指的是VICODI系统的网络用户界面，以知识门户的形式集成所有的Web应用功能，通过Web应用服务器使用系统的CE、TE、MSKS等功能，服务于Web用户。

(2)模型的检索过程

首先，在系统的用户界面上，用户通过文字(如一篇主题相关文档或用户自己输入的一段文字)来详细说明其提问的原始情境。

通过对其中参数(如关键词、年代、姓名等)的识别，系统为其产生一个合适的提问情境。情境构建是利用已经存储在VICODI文档库和用来表示领域知识(这里指的是历史领域)的本体库中的情境资源。用户通过选择一个时期、点击目录按钮和地图上的国家，来指定原始锁定情境。如果他选择以这种方式进入系统，系统将向他提供一个已被存储的、与锁定情境相关的列表及资源。检索能力强的用户可以通过对本体库的浏览，自行构建任意情境，并不断向其中添加特定情境要素。

当用户已经向系统提交了相关初始情境后，用户界面的左边显示的是以超链接形式展示的从用户提交的文档中发现的资源情境要素，同时还包括未在文档中出现的情境要素的超链接列表。右边是一个地图，与情境内容相关的国家在地图中表示为红色。颜色亮度随着提问情境中地区权重的增加而加强。

如果用户选择点击一个领域概念的超链接，则开始产生新一轮基于情境的提问。同时用户前面所提交文档情境中所有概念要素均被加入到新提问情境中。然而除了被选中领域的概念，其他的权重都将被降低。当前被选中的时间区间形成了提问情境的时间集。系统同时还提供针对用户当前具体情境的高级检索模式。点击“设置不同情境”按钮，用户能通过添加、删除时间区间、本体概念和实例，自由地修正其当前情境;而且基于时间和地区的提问可以直接从右边显示的地图展开检索。

(3)基于认知情景的检索策略

在VICODI检索模型中，将认知的行为维度、内容维度、环境维度以不同的侧重加以应用，以此作为语义揭示、语义应用的基础。该模型在认知内容维度上，构建了具有一定操作灵活性和领域适应性的本体;在认知行为维度上，通过对用户提问情境的构建，反映用户的任务相关、兴趣偏好等;在认知环境维度上，在针对不同文档构建的资源情境和针对特定用户、特定问题的用户情境之间进行情境筛选和匹配，从而实现语义概念和语义关联知识的检索。

基于认知情境的语义检索是今后信息检索发展的趋势之一。VICODI系统主要强调的是认知环境维度方面的情境在检索过程中的应用，通过情境导航和情境匹配来实施整个语义检索过程。

①资源情境的构建

VICODI资源情境(Resource Context)包括两个集合——概念集(conceptual part)和时间集(temporal part)。概念集包括的是加权的本体要素，时间集包括的是加权的时间区间。系统应用取值为0～1的浮点加权方法，同时时间的单位为“年”。

在支持语义检索的数字资源中，构建资源情境需要面对存储量相当多的信息资源，因此采用自动化方法必不可少。在VICODI语义检索系统中，情境构建是半自动的。

CE应用的技术是根据加权的1～N的分类方法产生初始文档情境的概念集。这种方法利用的是从训练过的数据(如注释类目相关值)，由分类器计算得出的交叉相关值，将文档看成多个词汇集合。这使CE能清晰地确认没有在文档中提及的领域概念，并且便于解决领域概念的模糊匹配问题。

构建文档情境的时间集就比较容易。CE仅在文本中寻找日期和时间区间，然后将它们与概念集要素的存在时间进行比较。只要CE发现它们之间存在有价值的相关，就赋予它高权重，否则就给一个低权重。不过常有干扰性相关出现，因为大多数文档都会有一个出版日期或是其他相关的日期，然而它们却不可以成为资源情境中的要素。

②用户情境的构建

在VICODI系统中，通过对用户的外部监控构建的特定用户情境，在某种程度上体现了用户特定的认知行为。初始的用户情境一般都是通过用户检索提问获取的，但是随着检索过程的持续，用户情境不断得到修正。在这里，对用户情境的构建过程就是一个对用户在检索过程中表现的认知行为的动态跟踪过程。当用户在查看某一资源的时候，就表现出其对该资源领域的兴趣，该资源情境同时也成为用户情境中的一部分。由此构造的用户情境在很大程度上反映出用户认知的动态行为信息。

在资源情境中，伴随每一个资源显示的是用户情境导航要素。它们的功能是当这些要素被用户激活的时候，能针对用户检索提问，指导基于情境的语义检索。在导航要素被激活之后，通过情境检索返回所有同当前资源在情境上相关的资源。

情境导航要素在VICODI的检索过程中是用户界面的重要组成部分。它们所对应的是当前资源情境的概念集与时间集的元素;且在检索过程中，它们起到的作用是激活下一个基于情境的检索提问。

VICODI系统将情境导航要素组成两个部分。一部分导航要素包括的是在资源文本中出现的所有领域概念。这部分导航要素以资源文本所产生的情境为基础，对每一个所提及的领域概念进行识别。文本中每一个情境要素的权重和实际位置都会被传递给转换引擎(TE)，形成文档的超链接。转换后的文本被存储起来，以便当该文档再一次出现的时候不用进行重复转换。导航要素的另一部分包括的是没有在资源文本中提及，但却属于相关资源情境中的概念。这两部分的要素都根据它们在当前资源情境中的权重给以不同表现形式，比如绝对相关的要素就字体加粗，相关性大些就显示为斜体，相关性小些就用下画线表示。

③情境导航与语义检索

在VICODI系统中利用情境要素的浏览，提供情境导航和语义检索功能。

该导航模式能逐步明确用户的检索目的，通过对用户检索决策的指导，弥补用户关于检索领域知识、多学科数字资源特点等方面的知识缺乏。因此在情境导航过程中，用户是参与其中的，而不是盲目接受系统的引导。该系统的情境导航要素包括两方面:一是用户给出的与问题相关的初始提问情境;二是系统根据与初始情境是否匹配，提供同该情境中要素相关的资源情境集合。用户可以在所有导航要素的整体引导下，展开对目标资源情境的浏览。

VICODI系统中，语义检索是通过情境匹配来实现的。情境匹配是在用户情境和资源情境之间进行的。其情境匹配算法是利用系统中本体的语义关联，对双方情境进行语义相似度计算，通过比较情境之间的相似距离实现的。这种在语义层面上，利用模糊计算进行的情境匹配，无论是在技术还是在检索效果上都超越了传统的信息检索方法。由于资源情境的庞杂，为了避免情境匹配过程中计算、处理等方面的浪费，系统提供了一种过滤机制，对资源情境先进行筛选而后匹配。这种以黑板机制为基础的情境筛选功能提高了整个系统的检索效率。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈