首页 百科知识 事件和问题管理

事件和问题管理

时间:2022-07-21 百科知识 版权反馈
【摘要】:问题管理有责任确保事件管理能获得关于已知错误和已纠正问题的最新信息。与事件管理一样,问题管理同样被纳入银联数据服务台中。目前,银联数据通过如表4.4所示的几个关键绩效指标来衡量事件和问题管理流程的有效性并识别待改进之处,根据统计频率定期收集这些指标值,并通过ISO 20000 IT服务管理体系的季度管理层服务报告向公司管理层呈现这些指标情况。表4.4 银联数据事件和问题管理流程KPI

1)事件和问题管理的概念和目标

事件是指不包含在标准服务操作之内,导致或可能导致服务中断或服务质量降低的非正常情况,而问题是一个或多个事件的未知的根本原因。企业需要事件管理流程来控制事件的处理过程,以对事件的影响程度、范围、紧急程度和处理事件所需的时间来评定事件的级别,制定不同等级事件处理策略,事件管理流程涉及服务的整个生命周期。

ISO 20000中定义的事件管理目标是尽快恢复约定的业务服务或响应服务要求,主要活动应包括:

(1)记录所有的事件。

(2)采用一定的流程来管理事件的影响,且流程应定义所有事件和记录、优先次序、业务影响、分类、更新、升级、解决和正式关闭。

(3)将客户报告的事件和服务请求的进展情况通知客户,当不能达到服务级别时应提前警告客户,并与客户约定改进计划。

(4)事件管理所涉及的所有人员都应该可以访问如已知错误、问题解决方案配置管理数据库等相关的信息,对重大事件应有流程进行分类及管理。

ISO 20000中定义的问题管理目标是最小化对业务的影响,主动识别、分析、管理事件原因直至问题关闭,主要活动应包括:

(1)记录和识别所有问题。

(2)建立识别、最小化或避免事件和问题影响的流程,同时该流程应定义所有问题的记录、分类、更新、升级、解决和关闭。

(3)采取预防措施减少潜在问题。

(4)纠正问题的根本原因所需的变更应提交变更管理流程。

(5)监控、回顾问题的解决情况,并对问题解决的有效性进行报告。

问题管理有责任确保事件管理能获得关于已知错误和已纠正问题的最新信息。尽管事件管理和问题管理是紧密相连的,但这两个流程的目的不一样,在事件管理流程中追求以最快的速度恢复业务的正常运行,而引起事件发生的根本原因或潜在原因就需要靠问题管理调查和解决。一个问题可能产生多个事件,一个事件也可能和多个问题有关,问题管理就是通过IT基础设施的调查和分析来查明事件发生的根本原因,制订解决方案和预防措施来保证同类事件不再发生。

结合自身业务,银联数据制订的事件管理流程的目标是解决在生产环境或灾备环境中发现的事件,迅速恢复至正常的业务状态及服务水平,从而最大限度地减小事件对用户及正常业务状态的影响。另外,银联数据的问题管理流程的目标是通过被动及主动识别和分析事件的根本原因,以达到从源头上防止相关事件的重复发生和最大限度地降低重大事件发生的可能性。

2)银联数据的事件和问题管理

对于生产系统发现的运行事件,银联数据的相关方会做出及时响应,逐级上报相关管理人员,并通过银联数据服务台进行记录、分析和跟踪,直至查找到根本原因并完成彻底处置。

(1)事件管理活动的主要内容。

问题管理的范围包括从现有的事件中识别、诊断及分析生产环境和灾备环境中现存的问题,包括:

(2)事件、问题的发现。

客户通过电话、邮件、银联数据服务台等多种途径向银联数据反映事件或问题,公司内部人员还可通过如下几种途径主动发现事件:

对没有找出根本原因仅以临时替代方案解决的事件,或是重大的可能导致对多家客户或重要客户服务中断的事件,需要升级为问题进行处理。此外,问题管理流程经理或相关部门经理也会定期总结每一类事件的发生数量及发生趋势,当发现重复发生的事件时,会进行相应的评估,决定是否将此类事件升级为问题做进一步的分析处理。

(3)事件分析和解决。

发现事件后,相关人员应在第一时间通过银联数据服务台新建事件单(紧急度为1、2级的事件,特殊情况下可以事后补单),在系统中记录事件的分类和排序等基础信息,事件ID、提交人ID、事件优先级等部分信息由系统生成。若为重大事件,事件提交人还应根据事件报告制度通知相关人员。

事件处理人接到事件单,根据经验或查阅知识库、配置库等调查诊断后,提供解决方案,并根据解决方案直接对事件进行处理。某些事件可能还需要通过变更才能获得解决。对于已处理完的事件,事后还会再次确认是否已经永久解决。如是,则关闭事件单;否则,转入问题管理流程做进一步的分析和解决。

(4)问题分析和解决。

与事件管理一样,问题管理同样被纳入银联数据服务台中。发现问题时,提交人首先在银联数据服务台中查看现有的未关闭问题单,判断问题是否已经被记录过,如果已被记录过,则把事件单与已有的问题单在系统中进行关联,建立索引。否则,在系统中新建一个问题单(记录问题、对问题进行描述、添加相关附件或处理信息)并建立与事件单的索引。然后,根据问题分类标准选择问题的类型,如果是从事件触发的问题,系统从被关联的事件单直接加载事件分类到问题分类。按照《问题优先级排序办法》对问题设定影响和紧急性,系统自动生成优先级别。

问题单建好后,提交给相关人员进行问题分析,寻找问题的根本原因,研究解决方案,并由相关人员在问题单中将这一过程作相应记录。如果解决方案需要通过变更和发布来完成,则在系统中建立变更单,进行相关变更和发布流程,系统自动建立变更和问题之间的索引。问题处理完后,相关处理人填写问题处理结果,并提交给最初的问题提交人进行确认,在保证问题已得到充分有效的解决及确认之后,方能关闭该问题单。

(5)关键绩效指标(KPI)。

目前,银联数据通过如表4.4所示的几个关键绩效指标来衡量事件和问题管理流程的有效性并识别待改进之处,根据统计频率定期收集这些指标值,并通过ISO 20000 IT服务管理体系的季度管理层服务报告向公司管理层呈现这些指标情况。另外,每月也会对事件进行统计(在公司月度例会材料上体现),需要时进行事件的分析,对于重大事件还会进行事件的调查,并编写《事件报告》,组织各部门相关人员进行深入学习、吸取教训,预防同类事件再次发生。

表4.4 银联数据事件和问题管理流程KPI

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈