首页 理论教育 知识获取方法

知识获取方法

时间:2022-03-04 理论教育 版权反馈
【摘要】:所谓自动知识获取是指系统采用相关的知识获取方法,直接从信息源“学习”相关的基础知识,以及从系统自身的运行实践中总结、归纳出新知识,不断自我完善,建立起性能优良的知识库。自动知识获取是一种理想的知识获取方式,它涉及人工智能的多个研究领域,如模式识别、自然语言理解、机器学习等,对硬件亦有较高的要求。

6.1.3 知识获取方法

知识系统可用多种方法从多种信息源获取知识。如通过与专家会谈、观察专家的问题求解过程、利用智能编辑系统、应用机器学习中的归纳程序、使用文本理解系统等方式,获取人类专家的知识或将其转换成所需要的形式,也可以从经验数据、实例、出版物、数据库以及网络信息源中获取各种知识。一般来说,按照知识获取的自动化程度,可以将知识获取划分为非自动知识获取和自动知识获取两类基本方式[3,4]

1.非自动知识获取方式

在非自动知识获取方式中,知识获取分两步进行:首先由知识工程师从相应信息源获取知识;然后再由知识工程师通过某种知识编辑软件将知识输入到知识库中。

(1)知识工程师。知识工程师既懂得如何与领域专家打交道,能从领域专家及有关文献中获得知识系统所需要的知识,又熟悉知识处理技术。其主要任务是:获取知识系统所需要的原始知识;对其进行分析、归纳、整理、升华,用自然语言描述之;然后由领域专家审查;把最后确定的知识内容用知识表示语言表示出来,通过知识编辑器进行编辑输入。

(2)知识编辑器。知识编辑器是一种用于知识编辑和输入的软件,一般采用交互工作方式,其主要功能是:

①将获取的知识转换成计算机可表示的内部形式,并输入知识库。

②检测知识的错误,包括内容错误和语法错误,例如,知识的正确性、完整性和一致性等;并报告错误性质、原因与部位,以便进行修正。

非自动知识获取方式是知识库系统建造中用得较普遍的一种知识获取方式。早期专家系统都是运用这种方式建造的,如DENDRAL、MYCIN等。但采用这种方式建立知识库是一件相当困难且费时费力的工作,已构成知识工程的瓶颈。为了解决这个难题,人们尝试运用各种理论和方法实现知识的自动化获取。

2.自动知识获取方式

所谓自动知识获取是指系统采用相关的知识获取方法,直接从信息源“学习”相关的基础知识,以及从系统自身的运行实践中总结、归纳出新知识,不断自我完善,建立起性能优良的知识库。

实现自动知识获取的主要方法有:

(1)自然语言理解。自然语言理解方式主要借助于自然语言处理技术,针对文本类型的信息源,通过语法、语义分析,推导文本内容属性,抽取与领域相关的语义实体及其关系,实现知识获取。从本质上说,虽然自然语言理解是最理想的自动知识获取方法,但由于自然语言处理中多项难点技术(如抽词技术、切分词技术、短语识别技术等)尚未得到有效解决,因此,给基于自然语言理解的知识自动获取利用带来一定困难。

(2)模式识别。基于模式识别的知识获取方法主要针对多媒体信息源(如图片、语音波形、符号等),采用统计方法等对事物或现象进行描述、辨认、分类和解释,从经数字化处理后的数据中识别事物对象的特征。

(3)机器学习。机器学习是系统利用各种学习方法来获取知识,是一种高级的全自动化的知识获取方法。机器学习还具有从运行实践中学习的能力,能纠正可能存在的错误,产生新的知识,从而不断进行知识库的积累、修改和扩充。

(4)数据挖掘与知识发现。基于数据挖掘的知识获取是近几年发展起来的新方法,它主要针对结构化的数据库,采用统计学习等定量化分析方法,发现大量数据之间所存在的关联。虽然数据挖掘与机器学习都从数据中提取知识,但两者之间存在区别:机器学习主要针对特定模式的数据进行学习;数据挖掘则是从实际的海量数据源中发现、抽取知识。由于数据挖掘技术简单易行,目前已逐步发展成为金融业、保险业、零售业、电信、生物等领域中颇具影响力的知识获取工具。

(5)机器感知。基于机器感知的知识获取主要依靠机器的视觉、听觉、触觉、味觉等传感器获取生理及行为特征信号,直接感知外部世界。它需要采用人工智能方法和技术,观测、建模、识别外界信息,从而创建感知能力。机器感知是一项高智能的活动,比自然语言理解、模式识别具有更复杂的能力,目前还只是处于探索中。

自动知识获取是一种理想的知识获取方式,它涉及人工智能的多个研究领域,如模式识别、自然语言理解、机器学习等,对硬件亦有较高的要求。而目前这些领域尚处于研究阶段,有许多理论及技术上的问题需要做进一步的研究,就目前已经取得的研究成果而言,尚不足以真正实现自动知识获取。因此,知识的完全自动获取目前还只能作为人们为之奋斗的目标。有效的知识获取需要根据问题类型及其具有的知识信息和数据信息状况,采取合适的知识获取策略,将自动获取方式和非自动获取方式进行有机结合,选择不同的知识获取方法,如表6-1所示。本章将主要论述机器学习和数据挖掘这两类方法。

表6-1知识获取策略与方法的选择

img42

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈