首页 理论教育 基于知识发现的知识获取模型

基于知识发现的知识获取模型

时间:2022-03-04 理论教育 版权反馈
【摘要】:基于KDD的知识自动获取可以实现从变化的环境中学习、发现新的知识,构建知识库,并进行一系列的检测和更新,丰富和完善知识库系统。前述基于知识库的KDD过程可以有效地发现新知识,而如何将发现的这些新知识与知识库中的现有知识进行融合并生成新的知识库,成为动态环境下知识自动获取的又一关键问题。

6.3.7 基于知识发现的知识获取模型

知识获取中信息源的范围非常广泛,可以是专家的经验,也可以是社会科学、商业数据等。它们的数据结构也各不相同,可以是层次的、网状的、关系的和面向对象的半结构化与结构化数据,也可以是科技文献等无结构化数据。随着数据库、网络的出现,知识发现的对象不仅仅侧重于专家经验,日益丰富的数据库信息、Web信息已成为大量而有用的知识来源。如何从超大数量、动态变化的信息源中有效地抽取出特定的知识是知识获取中的热点和难点。基于KDD的知识自动获取可以实现从变化的环境中学习、发现新的知识,构建知识库,并进行一系列的检测和更新,丰富和完善知识库系统。图6-9是基于KDD的知识自动获取模型,它主要包括四个模块:基于知识库的约束生成模块、基于约束的知识发现模块、支持演化知识库的知识库管理模块以及激发整个知识发现与知识演化过程的知识应用模块[17]

img53

图6-9 基于KDD的知识自动获取模型结构

该模型是一个演化循环的过程。新一轮的知识获取过程从约束生成模块开始。该模块一方面从知识库中获得先验知识输入,另一方面从知识发现模块获得算法参数输入,结合两类输入和约束生成机制,该模块自动生成约束集合,代表先验知识指导知识发现的全过程。知识发现模块在约束生成模块的指导下,从数据库发现、提炼新的知识。知识库管理模块结合上述发现的新模式与现有知识库中的知识进行检测,融合了原有知识和新环境特性,将两者合并为新的知识库并更新现有知识库。知识应用模块不断运用更新后的知识库中的知识处理运行时数据,并根据真实值反馈判断当前知识库能否满足应用需求。如果当前知识库中的知识已经过时(例如当环境发生了变化),知识应用模块将利用新的运行时数据更新数据库,并激发约束生成模块开始新一轮的知识获取过程,形成连续的知识演化循环,自动化地实现动态环境下的知识获取。这一螺旋上升的循环过程使模型获取的知识越来越丰富、越来越完整。

1.约束生成模块

该模块从知识库自动产生对KDD过程的约束。它获得知识库中的先验知识输入和KDD模块的参数输入,输出对KDD过程的约束。

由于独立进行的KDD过程容易发现大量与知识库中现有知识重复的新模式,以及不满足应用领域环境的无效模式,因此需要通过引入先验知识来设定目标规则形式,滤除不合理模式,提高知识发现结果的潜在有用性。引入先验知识的方法通常有两种:一是由知识工程师从领域专家处直接获得他们的知识,然后编码存储到应用系统之中;另一种是提供人机接口由专家使用,由专家运用他们的知识指导KDD过程的进行。然而,这类方法都只能适用于静态信息源的情况,而且通常只能引入少量基本的、且反复出现的静态知识;而当应用环境不断变化时,知识库是不断演化的,显然,编码或者手工指导KDD过程的方法都具有局限性。因此,将知识库中的现有知识作为KDD过程的先验知识,可以剔除无关数据、缩小搜索范围,降低数据挖掘过程的计算复杂度;同时提高知识自动获取的效率和性能。

该模块通过约束利用知识库中现有知识,其方法的基本思想是:根据一定的约束生成机制,自动从知识库中产生约束,这些约束在一定程度上反映了知识库中的现有知识;利用这些约束指导KDD过程的进行,实现基于约束的数据挖掘,即相当于利用知识库中的现有知识指导KDD过程的进行。这样,整个约束生成和基于约束的KDD过程都可以自动地进行,减少手工操作的任务量,极大地提高工作效率及其实时性。

2.KDD模块

该模块的功能在于实现基于知识库指导的知识获取。

如何有效地结合领域知识进行数据挖掘是提高知识获取与发现效率和性能的关键之一。本模块将用户知识和领域知识存储于知识库中,通过自动化的机制从知识库中生成限制和指导KDD过程的约束,并在此约束的基础上进行知识发现。

KDD模块由数据选择、数据预处理、数据转换、数据挖掘与解释评价这五个子步骤组成。其中,数据选择子步骤依据相应的约束选出相关的属性和数据集;数据预处理子步骤筛选掉非法的记录并补齐缺失值;数据挖掘子步骤实现基于约束的挖掘;在解释评价子步骤中,根据满足约束的程度对目标集进行排序选优。

3.知识库管理模块

随着知识发现过程的不断进行,知识获取系统应能即时根据环境知识的变化,更新知识库中的知识,逐渐发展、完善知识库。

前述基于知识库的KDD过程可以有效地发现新知识,而如何将发现的这些新知识与知识库中的现有知识进行融合并生成新的知识库,成为动态环境下知识自动获取的又一关键问题。

知识库管理模块由知识转换、知识检测和知识融合这三个子模块组成。该模块的功能在于对所发现的新知识与知识库中的原有知识进行一致性检测和完整性检测,并对不一致和不完整的情况进行处理。经过检测和消解后,两者融合为新的知识库,更新原有知识库,用于之后的知识应用与新一轮的知识发现过程。

4.知识应用模块

该模块由应用系统和运行监控子模块组成,可以将知识库中的知识应用于实际的系统运行过程,并从外界获得反馈。当反馈结果表明知识库应用系统处理结果与实际情况存在较大误差时,运行监控模块判定应用系统运行环境已发生变化,知识需要更新,于是激发新一轮的知识获取过程。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈