首页 理论教育 决策理论的专家系统

决策理论的专家系统

时间:2022-02-11 理论教育 版权反馈
【摘要】:决策网络的加入意味着可以开发出推荐最优决策的专家系统,它们能反映出用户的偏好以及可得到的证据。现在我们描述用于决策理论专家系统中的知识工程过程。一个针对这个问题的决策理论专家系统,可以由至少包括一个领域专家和一个知识工程人员的小组进行创建。但是专家很难分别单独地思考这些,所以它们是结合在一起的,其中Treatment(治疗)取值是诸如“一个月内进行外科手术”的方案。

16.7 决策理论的专家系统

在20世纪50和60年代演化发展起来的决策分析领域,研究了将决策理论应用于实际决策问题。它被用于在一些高风险的重要领域帮助制定理性决策,比如商业、政府、法律、军事策略、医学诊断和公共健康、工程设计以及资源管理。这个过程涉及到对于可能的行动和结果,以及每个结果上的偏好的仔细研究。传统上,决策分析讨论两个角色:决策制定者给出结果之间的偏好,而决策分析者枚举可能的行动和结果,从决策制定者处得到偏好,以决定行动的最佳过程。直到 20 世纪 80 年代早期,决策分析的主要目的是帮助人们做出真正反映他们自己偏好的决策。现在,越来越多的决策过程被自动化,决策分析被用来保证自动化的过程行为表现如所期望的。

我们在第十四章中讨论过,早期专家系统的研究专注于回答问题而不是进行决策。那些系统实际上推荐行动而不提供关于事实的观点,它们通常是使用条件-行动规则做到这点的,而不是使用关于结果和偏好的明确表示。20世纪80年代晚期涌现出来的贝叶斯网络,使得建造从证据产生可靠的概率推理的大规模系统成为可能。决策网络的加入意味着可以开发出推荐最优决策的专家系统,它们能反映出用户的偏好以及可得到的证据。

结合效用的系统能够避免与咨询过程联系在一起的最常见缺陷之一:把似然性和重要性相混淆。例如,在早期医学专家系统中,常见的策略是按照似然性的顺序来排列可能的诊断,报告最可能的那个诊断。不幸的是,这可能是灾难性的!在一般的实践中,对于大多数的病人,两个最可能的诊断通常是“你什么病都没有”和“你患有重感冒”,但是如果对一个给定病人,第 3 个最可能的诊断是肺癌,那就是一件严重的事情了。显然,测试或者治疗计划应该同时取决于概率和效用。

现在我们描述用于决策理论专家系统中的知识工程过程。作为例子我们将考虑为一种儿童先天性心脏病(参见Lucas,1996)选择医疗方案的问题。

大约0.8%的儿童有先天性心脏异常,最常见的是大动脉收缩(一种大动脉压迫症)。它可以通过外科手术、血管扩张(在动脉内放置一个气球来扩张大动脉)或者药物进行治疗。问题是决定使用什么治疗方法以及什么时候进行治疗:婴儿越小,某些治疗的风险越大,但是病人不可能等得太久。一个针对这个问题的决策理论专家系统,可以由至少包括一个领域专家(儿科心脏病学家)和一个知识工程人员的小组进行创建。创建过程可以分解为下列步骤(可以与第 8.4 节中开发一个基于逻辑的系统的步骤相比较)。

创建一个因果模型。确定什么是可能症状、失调、治疗和结果。然后在它们之间画上弧线,指示何种失调引发什么症状,如何通过治疗减轻失调。其中有些是领域专家所熟知的,有些来自于文献。这个模型常常与医学教科书中提供的非形式化的图形描述匹配得很好。

简化成一个定性决策模型。由于我们使用这个模型来制定治疗决策,而不是为了其他目的(比如确定某些症状/失调组合的联合概率),我们通常能通过删除治疗决策中未涉及到的变量进行简化。有时候,变量必须被分离或者联合以符合专家的直觉。例如,原始的动脉收缩模型有一个值为surgery(外科手术),angioplasty(血管扩张)和medication(药物治疗)的Treatment(治疗)变量,和一个为治疗计时的独立变量 Timing(计时)。但是专家很难分别单独地思考这些,所以它们是结合在一起的,其中Treatment(治疗)取值是诸如“一个月内进行外科手术”的方案。这为我们提供了图16.9中的模型。


图16.9 动脉收缩的推理图(承蒙Peter Lucas允许使用本图)

分配概率。概率可以来自患者数据库、文献研究或者专家的主观评估。对于文献给出错误种类的概率的情况,可以使用诸如贝叶斯规则和边缘化之类的技术来计算期望的概率。已经发现在给定一个原因条件下评估结果的概率(例如P(dyspnoea|heartfailure)),专家的能力是最佳的,而不是其他的方法。

分配效用。当可能的结果数目很少时,可以单独地枚举或者评价它们。我们将创建一个从最好到最坏结果的范围,并且给每个结果一个数值,例如死亡是 −1000,而完全康复是 0。然后我们将把其它结果也放置在这个范围内。专家就可以完成这些,不过如果有患者(或者在患者是婴儿的情况下,患者的父母)参与会更好些,这是因为不同的人有不同的偏好。如果有指数级的很多结果,我们需要某种方法,使用多属性效用函数将它们结合起来。例如,我们可以规定各种并发症的负效用是可以做加法的。

验证和改进模型。为了评价该系统,我们将需要一组正确的 (输入, 输出) 对;一个用于比较的所谓金牌标准。对于医疗专家系统,这通常意味着集合可用的最好医生,给他们一些病例,询问他们的诊断和推荐的治疗计划。然后我们察看系统与他们的推荐之间匹配程度如何。如果系统表现很差,我们尝试分离那些出错的部分并且修理它们。“反向”运行系统可能是有用的。取代为系统提供症状并且要求它做出诊断的方式,我们可以为它提供一个诊断,比如“心力衰竭”,检查出现心跳过速之类的症状的预测概率,并且与医学文献比较。

执行敏感性分析。这个重要的步骤检验最佳决策是否对分配的概率和效用的小变化敏感,这是通过系统地变化那些参数并再次运行评价过程完成的。如果小变化导致非常不同的决策,那么花费更多的资源以收集更好的数据可能是值得的。如果所有的变化导致相同的决策,那么用户将更有信心这是正确的决策。敏感性分析是尤其重要的,因为对专家系统的概率方法主要的批评之一就是太难评估所需的数值概率。敏感性分析通常显示出很多数值只需要非常近似地指定。例如,我们可能对先验概率P(tachycardia) 感到不确定,但是如果我们为这个概率尝试了许多不同的值,而在每种情况下,推理图中每个推荐的行动是同样的,那么我们对自己的无知的担心就可以少一些(即,某些知识细节的缺乏或者错误不会对结果造成很大影响——译者注)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈