基于概念的学习

时间：2023-03-04 理论教育版权反馈

【摘要】：应用演绎概念学习方法，可对一个实例进行内部分析，来同化大量信息。在概念学习系统中，为了从实例推导概念，必须具有问题领域中起关键作用的知识。它可被用于同化新知识，使学习机制建立关于对象或未来事件的期望值。因此，基于模型的学习综合运用了解释和归纳学习方法。例如IOTA智能信息检索系统应用词的同现率统计和伪语法模型，从自然语言文本获取专业知识，建立专业知识库。

6.2.4　基于概念的学习

在人工智能领域中，概念学习有着特殊的含义，通常被认为是从环境中获取结构描述(这个描述就叫做一个概念、一个模型或一个假设)。这里仅讨论智能信息系统中的概念学习、研究领域对象(如文献、专业术语、用户、提问等)及其关系的学习方法。

从应用的推理方式来看，有两种常用的概念学习方法:归纳概念学习和演绎概念学习。

1.归纳概念学习

归纳概念学习就是从经验实例中推导出一般结论。给出背景知识(BK)和概念的实例集合(E)，当满足以下条件可以推导出概念C:

(a)BK\→E实例不是背景知识的逻辑结论

(b)BK∪E\→～C概念与实例、背景知识不矛盾

(c)BK∪C→E实例是概念和背景知识的逻辑结论

有时，由于描述空间的复杂性、缺乏专业知识或表达定义的困难，无法提供概念的显示描述，则实例归纳学习就很有用。应用该学习方法，可从专家或用户提供的实例中学习，还可从数据库的事实学习，发现和构造模型与规则，用来描述新的概念。

例如，智能信息系统可根据用户提供的背景知识和查询实例，应用归纳学习方法，建立用户分类模型。假设每个用户实例包括用户名、职业、学历、使用的专业概念、交互方式、系统经验等属性，在收集实例时，应识别重要的属性，减少次要的属性个数，删除无用条件，并给每个属性赋予重要程度值。如此处理，不仅提高了学习的经济性(减少了存储空间与计算量)，而且可避免学习处理的错误导向。对于获取用户分类模型的任务来说，用户实例中的专业概念和系统经验是最重要的属性，他们描述了用户的领域知识水平和应用系统的技能。对每个实例的属性赋予重要程度值后，应用实例归纳学习方法(不同于简单的统计)，可以判别哪些用户是专家，哪些用户是无经验的新手，以建立用户分类模型，并在查询实用过程中，逐步精练，直到满足所期望的要求为止。

应用归纳学习方法，还可以根据概念之间的相似和相邻关系推导出新的概念和新的关系。例如，已知事实

sim(c₁，c₂)表示概念c₁和c₂相似

sim(c₁，c₃)表示概念c₁和c₃相似和相似传递规则

if sim(X，Y)and sim(X，Z)

then sim(Y，Z);可以归纳推导出概念c₁和c₃之间的相似关系。

2.演绎概念学习

演绎概念学习也称解释型学习。演绎概念学习应用抽象的概念定义和领域理论，解释为什么一个观察实例表示一个给定概念。基于这种解释，可推导出一个可使用的概念定义。

已知:

一个抽象的概念描述;

概念的一个实例;

领域理论和操作标准;

确定:

一个包含该实例的可用概念描述。

其中，实例可从领域理论中演绎出来，而归纳概念学习中的实例不能从背景知识演绎出来。

应用演绎概念学习方法，可对一个实例进行内部分析，来同化大量信息。学习处理对于知识库中与实例相关的部分进行操作，清晰地解释假设或规则。为此，它必须解释有关效果，证明所给的实例，然后概括这种解释，以用于其他实例。

这两种概念学习方法对应着概括和分析方法。两者都涉及查找，但存在以下不同点:归纳方法应用较一般的描述，而演绎方法应用推理语言表达概念;归纳方法用较复杂的顺序控制查找，而演绎达到目标则终止;归纳的结果是学习到的新概念，演绎结果是查找路径本身。

在概念学习系统中，为了从实例推导概念，必须具有问题领域中起关键作用的知识。依据拥有背景知识的多少，概念学习可分为知识贫乏型学习和知识丰富型学习。

(1)知识贫乏型学习

当学习过程中具有很少或没有明显的领域知识可用时，可采用知识贫乏型学习方法。它不要求精细的知识表示和推理，依赖于事件的发生。该学习方法可细分为以下三种类型。

①参数学习:该方法预先描述模型的数字参数，用统计方法利用知识。例如，在向量模式信息检索系统中，使用标引词和权值(词在文献中的重要性或出现频率)描述文献，给检索词加权(重要程度)描述提问。学习方法集中于权值的操作，主要根据用户对检索结果的相关反馈信息，修改提问或文献中词的权值。例如提高相关文献中词的权值，降低不相关文献中词的权值，或将该词删除，从而寻找正确的权值。同时还可利用文献的词频统计信息，构造词表知识库，并在使用过程中，不断利用相关反馈，修改词表中的词和词之间的关系。

②基于相似性的学习:该方法对于可能的概念描述空间，根据实例结构之间的相似性或差异，寻找最好的描述。这种学习处理应用基于统计方法的似然推理。例如利用相似测量，查找文献与提问的最佳匹配模式，以及获取概念之间的相似关系和从属关系。

③分级学习:每当学到一个概念，该方法就扩展描述语言。它允许使用旧的概念建立新的概念描述，因此，背景知识可不断增加。

(2)知识丰富型学习

这种类型的学习主要依赖于知识库和推理，即利用计算机中存储的大量信息进行学习。它又细分为以下两种不同方法。

①基于模型的学习:模型(如框架、模式等)常常描述问题领域的深层知识结构。它可被用于同化新知识，使学习机制建立关于对象或未来事件的期望值。当有实例违背模型的期望值，则学习机制将查找一个解释，从而扩展新知识。利用模型可以执行定性模拟，自动产生任何可能概念或行为的实例，然后应用这些实例进行归纳学习，产生可用的新概念或决策规则。因此，基于模型的学习综合运用了解释和归纳学习方法。

利用这种学习方法，可对较窄的专业领域建立标准的语法模型和语义模型，然后利用模型结构来定义新的概念。当一个语句满足这种结构模型，则要求获取处理，概括出新词汇，还可以归纳出新的词间关系或构词规则，建立和扩展专业词表。例如IOTA智能信息检索系统应用词的同现率统计和伪语法模型，从自然语言文本获取专业知识，建立专业知识库。同理，利用问题领域的分类模型(如文献分类模型)，对用户初始提问信息进行解释、修改和扩充，可以产生理想的提问描述。

②通过发现学习:它是系统自身的操作，执行实验来扩展系统的知识库。它可利用演绎方式或归纳方式，查找感兴趣的事物，检验概念的实例来形成猜测，或证明这些猜测。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈