保险公司对中介选择的数据挖掘

时间：2022-11-20 理论教育版权反馈

【摘要】：由于“四从”模型考虑的影响因素非常多，传统的用统计、精算建立费率表的方法已经无法实现，用数据挖掘技术建立模型，并将车险定价模型直接嵌入系统，实现实时个性化报价，这是未来车险经营的必由之路。

第四节　保险公司对中介选择的数据挖掘

一、数据挖掘在中介选择中的作用

保险公司数据挖掘技术的应用领域基本上与保险中介的应用领域相同，但各领域的应用程度有所差别。保险中介应用数据挖掘技术更集中一些，如营销响应方面的应用;而保险公司应用数据挖掘技术的范围更广泛、更综合，如欺诈监测、代理人甄选等方面都有广泛的需求。此外，有些数据挖掘应用领域是保险公司独有的，保险中介一般不涉及，比如车险定价模型方面，国际领先的保险公司，已经用数据挖掘方法建立了“四从”(从车、从驾驶员、从驾驶区域、从历史行为)的综合车险定价模型，取得了高于同业的利润率，占据了明显的竞争优势。由于“四从”模型考虑的影响因素非常多，传统的用统计、精算建立费率表的方法已经无法实现，用数据挖掘技术建立模型，并将车险定价模型直接嵌入系统，实现实时个性化报价，这是未来车险经营的必由之路。

从保险公司的角度应用数据挖掘技术，与保险中介密切相关的领域是应用数据挖掘技术辅助中介选择。保险行业是高度依赖中介进行营销推广的行业之一，保险行业存在着严重的信息不对称，一方面，投保人和被保险人对于保险的了解和认识就要落后于保险公司，投保人和被保险人对于保险技术和实务的了解也要落后于保险公司，投保人和被保险人对于保险公司经营信息的了解要落后于保险公司，形成了保险公司对投保人和被保险人的信息优势;另一方面，在寿险市场上，由于投保人对被保险人的身体状况和健康状况往往掌握更多的信息，而保险人难以获得准确信息，在财产保险市场上，由于投保方实际控制和保管着保险标的物，对保险标的物的风险水平有更好的了解，而保险人往往难以获得相关具体信息，逆向选择和道德风险就突现出来。中介的产生就是为了促进交易顺利进行，减少信息不对称带来的不利影响，保险中介也是如此。由于保险行业存在着严重的信息不对称，要减少以至消除信息不对称的消极影响，就必须想办法消除保险人和被保险人在保险知识方面的差距，保险中介作为联系保险人和被保险人的纽带，正是合适的角色。

虽然保险中介介入保险市场，可以一定程度上降低信息不对称的程度，促进保险交易顺利进行，然而，由于交易过程中增加了第三方，同时也会在其他方面产生信息不对称。保险公司与保险中介之间存在信息不对称，保险中介与投保人和被保险人之间也存在信息不对称。保险中介应用数据挖掘技术，可以有效地理解和监测投保人和被保险人的心理和行为，降低保险中介与投保人和被保险人之间的信息不对称。同样保险公司应用数据挖掘技术，也可以有效地降低保险公司与保险中介之间的信息不对称。

保险公司在中介选择方面应用数据挖掘技术又可细分为三个方面，分别是代理人甄选、代理人培训和中介渠道选择。下面将分别进行简介。

(一)代理人甄选

代理人甄选数据挖掘的主要任务是，建立代理人素质模型，收集代理人的包括生活背景、职业背景、教育背景、性向测试等诸多影响因素信息，并使用代理人成就的历史数据进行数据挖掘，生成代理人甄选模型。该模型可以在每位代理人进入保险行业时，就计算出其最终发展成为绩优销售人员的概率，从而指导公司有针对性地选择高潜能人员，避免人力资源投入的浪费，提高人力资源总体投入效率。

(二)代理人培训

代理人潜能的充分发挥离不开后期有效的培训教育，传统的代理人培训往往是“普适性”的，无法针对不同代理人的特点，一方面许多代理人参加了没有必要的培训，浪费了公司的培训资源，浪费了代理人的培训时间;另一方面，许多代理人没有得到急需的个性化能力提升培训，使许多具有潜能的代理人没有充分实现其潜在价值。

应用代理人素质模型，可以得到每位代理人当前能力与绩优销售人员所需能力的差异，从而有针对性地提出其急需提升的能力和培训课程。比如，模型显示某位代理人在其他方面已经达到绩优销售人员的能力标准，只是“保险行业经验”一项缺乏，在课程方面就急需加强保险知识的培训，并且安排较密集的实践培训，使其尽快积累保险行业实践经验。再如，模型显示某位代理人在其他方面已经达到绩优销售人员的能力标准，但是“思维能力”一项不达标，培训方面就不应再侧重于保险知识，而应侧重于更基础的思维习惯和思维方式的培训，否则，再多的培训和实践经验也起不到良好的作用。

(三)中介渠道选择

保险公司的销售渠道一般分为自有渠道和中介渠道两大类，保险公司的自有渠道又包括传统的公司员工和新兴的电话销售渠道、网络销售渠道等，中介渠道一般包括兼业代理人(主要是车商4S店、银行、邮储等)、个人代理人、专业代理公司和经纪公司等。如此多的销售渠道，如何来进行保险产品、渠道和客户的匹配呢?保险公司一直使用统计、精算等传统方法进行渠道选择，一般只考虑各渠道的历史效率，而没有考虑代理人甄选的附加影响。比如，在银行渠道中，由于没有采用代理人甄选模型，所选择的保险代理销售人员往往并不是最具潜能的代理人。保险公司会使用这些代理人的业绩数据进行统计分析，“精算”出该银行网点的“能力”，进而决定中介渠道的选择，这种传统的统计和精算方法，确实是低估了许多银行网点的潜能，因此造成中介渠道选择决策的失误。采用数据挖掘方法，就可以将代理人甄选的潜能提升和代理人个性化培训的潜能提升等因素也结合到中介渠道的选择决策中来，充分挖掘保险中介的潜能，提高保险中介渠道选择的准确性。

二、典型案例分析

(一)个人代理人甄选研究的目的

1992年美国友邦保险公司上海分公司引入了个人代理制，1995年以后国内各保险公司纷纷效仿，目前我国保险市场上的个人代理人已有几十万。个人代理人在我国保险市场上能得到这样迅速的发展，是其自身的特点及优势决定的。首先，通过个人代理人可以加强保险公司与客户的沟通了解，促进保险商品的销售;其次，个人代理制度打破了传统的分配方式和晋升机制，激发了寿险营销员的积极性;最后，个人代理制度能为保险公司节省组织运营成本。

但我国保险个人代理制度存在不少问题，首先是个人代理人整体素质偏低，制约了保险业的快速发展;其次是首年制的佣金制度，不利于个人代理人队伍的稳定;第三是个人代理人存在片面逐利行为，会加大公司的经营风险;最后是个人代理人的短期行为损害消费者利益，破坏保险行业形象。

应用数据挖掘技术对个人代理人素质模型进行专题研究有四个方面的意义：一是理论联系实际，建立个人代理人素质模型，总结个人代理人胜任素质的结论，并提出针对性的个人代理人甄选建议和培训建议，提高保险行业的人力资源投入效率;二是从源头上提升个人代理人素质，改善保险消费者的体验，提升客户满意度，进而提升保险行业信誉，改善行业形象;三是验证数据挖掘技术在保险行业的适用性，推动数据挖掘技术在中国保险行业的应用和推广，助力中国保险行业转型升级，打造保险业竞争优势新源泉。

(二)个人代理人甄选的数据挖掘

1.商业理解

本数据挖掘项目的业务目标是：结合个人代理人的个人特征和工作风格、思维特征、情绪管理能力的自我评价量表，进行数据挖掘建模，建立个人代理人甄选评分体系，可以对新个人代理人的销售潜能进行预估，帮助人力资源管理部门进行筛选和相应的资源投入，并辅助制订个人代理人的个性化培训计划。

2.数据理解

2011年4月至5月，研究人员使用《保险营销人员胜任特征调查问卷》和《保险营销人员工作状况评价问卷》，在某地的保险机构进行了专项调查，获取了一定量的访问样本。^[3]

《保险营销人员胜任特征调查问卷》由个人代理人填写，主要包括七方面的调查内容，分别是思维习惯、工作习惯、工作态度、情绪管理、客户信息处理、个人基本信息和业绩水平。《保险营销人员工作状况评价问卷》由个人代理人的上级主管对每位个人代理人进行评价填写，主要内容包括三个方面，分别是工作评价、业绩评价和客户服务评价。

本数据挖掘“个人代理人甄选研究”所需要的变量包含在调查问卷内容中，以此作为数据挖掘的基础数据，进行了包括因子权重、维度的解释力等方面的研究，并采用C5.0进行建模。

为了更好地理解数据，先进行全变量探索建模：以个人代理人的相关特征和自评价量表数据作为输入变量，以个人代理人2011年度前4个月的平均保费收入为输出变量，并将平均保费收入分为低(1万以下)、中(1～2万)、高(2万以上)三个区间，进行全变量探索建模，MODELER建模流程如图4－6所示。

全变量探索建模的模型结论如下：

全变量探索模型显示，上级对个人代理人的评分和工作年限是影响个人代理人业绩表现的最重要因素。

我们认为，代理人甄选模型中，不应当采用“事后因素”作为自变量，如上级对他的评价和进入公司后经历的时间等因素，虽然这些因素与其业绩的相关性很大，但个人代理人刚加入公司时，是不可能取得这样的“未来”数据的。同时，全变量探索模型中显示的相关性，其因果关系很可能是反向的，也就是说，个人代理人后来的业绩反过来会影响上级对他的评价，进而影响他在公司工作的时间长度。

图4－6　个人代理人甄选全变量探索建模流文件图

因此，经过数据理解和全变量探索模型阶段，我们将“事后因素”，如上级的评价和进入公司后经历的时间等因素，都排除而不用于正式的数据挖掘建模研究，以取得客观公正的研究结果。

3.数据准备

基于数据理解，我们首先对个人代理人的自评价量表数据进行因子分析和归类处理。

为了深入研究个人代理人的行为特质，拟合个人代理人的思维特征、工作风格以及情绪管理方面的表现，我们针对“关于您思维习惯和行为偏好的描述”、“您日常生活中体验和处理情绪的情形”和其他工作风格相关的项目，分别进行初步因子分析，并根据因子分析结果得到关于这三项的综合评分矩阵，如图4－7所示：

图4－7　个人代理人甄选全变量探索模型图

表4－7　个人代理人甄选因子分析表

续表

参照表4－7进行如下因子推断：

思维特性系数阵里，A9(对我来说，知道答案背后的原因比答案本身更重要)和A10(学习新的思考方式对我有吸引力)这两个项目的解释能力最强。说明个人代理人的思维特性在这两项里越符合，即分值越高，对该项评分的提高速度越快。

工作类系数阵里，C1(工作职责额外增加时，我不逃避)、B1(我主动解决问题)和C4(我努力工作，已成为我所从事的工作中最优秀的)这三个项目解释能力很强，说明个人代理人的工作努力程度和积极主动性是最重要的因素。

情绪管理系数阵里，D7(当我愤怒时，我通常能在很短时间内冷静下来)和D8(我对自己的情绪有很强的控制能力)这两项能力是重要的因素。

我们将上面的系数阵和我们相关问题的分数相乘并求和，就可以得出每个参与者对应项目的分数，下面用矩阵表示：

为了对结果的稳定性进行评估，我们进行了KMO检验，具体结果如表4－8所示。

表4－8　个人代理人甄选因子分析KMO检验表

续表

由表4－8可以看出，思维特性、工作类和情绪管理三个项目的KMO检验值分别为0.847、0.874和0.834，都属于“非常适合”的水平，结果解释能力非常强，说明我们的研究样本和推论之间的关系是相对稳定的。

然后我们进行输出变量标准化，个人代理人2011年月均收入在1万以下的定义为“差”，月均收入在1－2万的人员定义为“中”，2万以上定义为“优”。

4.建立模型

根据数据理解和数据准备，我们将相关变量的关系设置如下：

图4－8　个人代理人甄选变量设置图

将上面用系数阵算出的每个样本的思维评分、工作评分和情绪评分以及个人代理人的年龄、其他保险公司工作经验、入司前工作年限、学历、性别和婚姻状况作为输入变量，将标准化后的业绩分级作为目标变量，建立如下数据挖掘流：

图4－9　个人代理人甄选建模流文件图

经MODELER建模，得到以下模型(截图为部分显示内容)：

图4－10　个人代理人甄选模型图

5.模型评估

根据模型统计评估分析，发现模型的预测准确率在81.95%，在现有样本下，模型有非常强的解释能力。

图4－11　个人代理人甄选模型评估图

(三)个人代理人甄选模型的结论

各输入变量中，年龄、入司前工作年限、其他保险公司经验和性别是较重要的变量，解释能力较强。

在众多的模型结论中，我们可以发现一些有用的模式：

如果个人代理人入司前工作年限小于12年，形成“优”的条件为以下二者之一：

学历=1(中专及以下)并且其他保险公司的工作经验大于3年;

学历=2(大专及以上)并且性别=1思维评分大于9.758分。

如果个人代理人入司前工作年限大于12年，一般都容易成为“优”，但是思维评分低于7.435也会形成“差”。

(四)个人代理人甄选的业务建议

由于数据取得困难，本次研究的样本数据量偏少，且局限于某地区，所以具体的模型结论不一定可以正式大范围商业使用，仍需要用更大的数据量去调整模型，但所建模型准确性能达到80%以上，说明数据挖掘建模方法可以实现有效建模，是一次对研究方法的实证。

本次建模采用决策树C5.0的方法，模型不容易用文字解释，但模型可以执行。在商用时，采集同样格式的数据，就可以直接用模型计算出新个人代理人成长为“优”的潜能概率。

此外，通过比较个人代理人目前的能力数据和优秀个人代理标准能力数据，可以得到该个人代理人急需提升的能力，有针对性地安排培训方向和课程，有利于个人代理人的快速成长和提高个人代理人的留存概率。

附录A：车险电销客户销售体验研究

A6.客户销售体验研究

下面的题目将用于评价您在前期投保过程中的感觉与感受，请您对下面每句话的认同程度进行打分(用1－7来打分，1分表示非常不认同，7分表示非常认同)。

思考题

1.请思考客户研究对于保险中介的重要意义。

2.请列举客户的相关理论。

3.请总结数据挖掘与统计的主要不同点。

4.请简述CRISP－DM方法论的相关内容。

5.请说明保险中介相关的信息不对称及数据挖掘降低信息不对称的作用。

6.请操作或观察MODELER数据挖掘系统，并谈谈你的感受。

【注释】

[1]对提升度计算公式的总结参考了以下来源内容：http://www.dmstat1.com/res/DecileAnalysisPrimer.html

[2]本图为理论示意图，具体实际项目提升图的曲线往往不会如此平滑，详细说明请参考IBM网站：http:// pic.dhe.ibm.com/infocenter/db2luw/v9r7/topic/com.ibm.im.visual.doc/c_cumulative_lift_chart_class.html?resultof=% 22%6c%69%66%74%22%20%22%63%68%61%72%74%22%20

[3]因涉及商业机密，有关问卷内容和访问样本的数据不予提供。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈