首页 理论教育 损失资料的收集与整理

损失资料的收集与整理

时间:2022-11-14 理论教育 版权反馈
【摘要】:要对风险进行衡量,首先要收集足够充分的损失数据,对这些数据进行整理后,才便于风险管理人员对某一个或某几个特定风险事故发生的概率和风险事故发生后可能造成损失的严重程度作出定量分析。在实务中,进行风险评估时,往往没有足够的损失统计资料,且由于时间、经费等许多条件的限制,很难、甚至不可能取得所需要的足够数量的损失资料。

【任务情景】

某风险管理人员要对某出租汽车公司每次事故的损失风险进行评估,经过调查得知该公司每次事故的损失金额(单位: 万元)情况如表3-1所示:

表3-1 某出租汽车公司每次事故损失金额的原始数据 单位: 万元

经过初步观察我们发现,火灾损失金额最小的是1.3万元,最大的是23.5万元,并且很明显,损失金额大于20万元的极少,但是我们不能很快的说明,损失金额在5万元到10万元和10万元到15万元之间的事故发生次数是否同样多,因此我们要对数据进行整理,才能明显地看出它们的主要特征。

【任务描述】

要对风险进行衡量,首先要收集足够充分的损失数据,对这些数据进行整理后,才便于风险管理人员对某一个或某几个特定风险事故发生的概率和风险事故发生后可能造成损失的严重程度作出定量分析。那么我们要如何对这些杂乱无章的数据进行整理呢?

【知识链接】

一、风险评估的理论基础

(一)大数法则

大数法则为风险评估奠定了理论基础,它是指只要被观察的风险单位数量足够多,就可以对损失发生的概率、损失的严重程度评估出一定的数值来。而且,被观察的单位数越多,评估值就越精确。

例如,某一风险单位是否发生致损事故完全是偶然的,无规律可循。就一家工厂而言,何时发生火灾、什么原因引起火灾、火灾造成的损失有多大等,都是不确定的。

然而,当观察同类风险单位的数目较多时,这种致损事故就呈现出一定的规律性,显现出某种必然性的特征。例如,就一个城市而言,其每年发生火灾的频率、每件火灾事故的平均损失、年度火灾的总损失额及造成火灾的原因等,都有其规律可循。经验证明,被观察的同类单位数目越多,这种规律性就越明显。这时,可以看出风险事故的发生呈现出一种统计的规律性。

(二)概率推断的原理

单个风险事故是随机事件,它发生的时间、空间、损失严重程度都是不确定的。但就总体而言,风险事故的发生又呈现出某种统计的规律性。因此,采用概率论数理统计方法,可以求出风险事故出现状态的各种概率。如运用二项分布、泊松分布可以评估风险事故发生次数的概率。

(三)类推原理

数理统计学为从部分去推断总体,提供了非常成熟的理论和众多有效的方法。利用类推原理评估风险的优点在于,能弥补事故统计资料不足的缺陷。在实务中,进行风险评估时,往往没有足够的损失统计资料,且由于时间、经费等许多条件的限制,很难、甚至不可能取得所需要的足够数量的损失资料。因此,根据事件的相似关系,从已掌握的实际资料出发,运用科学的评估方法而得到的数据,可以基本符合实际情况,满足预测的需要。

(四)惯性原理

利用事物发展具有惯性的特征去评估风险,通常要求系统是稳定的。因为只有稳定的系统,事物之间的内在联系和某些特征才有可能延续下去。但实际上,系统的状态会受各种偶然因素的影响,绝对稳定的系统是不存在的。因此,在运用惯性原理时,只要求系统处于相对稳定的状态。

应特别注意的是,即使系统处于相对稳定状态,原系统的发展也绝不会是历史的重复,事物的发展不可能是过去状态的简单延续,而只是保持其基本发展趋势。在实务中,当运用过去的损失资料来评估未来的状态时,一方面要抓住惯性发展的主要趋势,另一方面还要研究可能出现的偏离和偏离程度,从而对评估结果进行适当的技术处理,使其更符合未来发展的实际结果。

延伸阅读

生命表的编制

生命表,又称死亡表,它是根据一定时期的特定国家(或地区)或特定人口群体(如保险公司的全体被保险人、某企业的全体员工)的有关生存状况统计资料,依照整数年龄编制而成的用以反映相应人口群体的生死规律的统计表。通常以10万(或100万)人作为0岁的生存人数,然后根据各年中死亡人数,各年年末生存人数计算各年龄人口的死亡率、生存率,列成表格,直至此10万人(100万人)全部死亡为止。生命表在有关人口的理论研究、某地区或某人口群体的新增人口与全体人口的测算、社会经济政策的制定、寿险公司的保费及责任准备金的计算等方面都有着极为重要的作用。

世界上第一张生命表是由英国天文学家埃德蒙·哈雷(Edmond Halley,1656—1742)于1693年编制而成的。20世纪90年代中国人民保险(集团)公司组织了大量的专家,成功编制出《中国人寿保险业经验生命表》,并于1997年4月1日起正式运用于人寿保险业务的经营核算中。生命表统计的主要项目一般分为五项: ①年龄,用X代表,表示年龄为X岁; ②年龄X岁的生存人数; ③年龄X岁的人在未来的一年内的死亡人数; ④年龄X岁的人在未来一年内的生存率; ⑤年龄X岁的人在未来一年内的死亡率。

1999年,中国保监会对新生命表编制征求各公司意见,并于2003年初正式决定编制中国人寿保险业的第二张经验生命表,观察期间为2000—2003,命名为“中国人寿保险行业经验生命表(2000—2003)”(以下简称“新生命表”)。2003年8月,正式启动了新生命表编制项目。新生命表编制完成后,2005年11月12日,中国保监会在北京组织召开了生命表专家评审会,评审会一致通过了新生命表。

这次生命表的数据来源于国内经营时间较长、数据量较大的6家寿险公司: 中国人寿、平安、太平洋、新华、泰康、友邦。6家公司共提交了1亿多条保单记录,占全行业同期保单数量的98%以上; 这在全世界生命表编制历史上,数据量是数一数二的。新生命表于2006年1月1日生效。

新生命表包括非养老金业务男女表和养老金业务男女表共两套四张表,其结构与原生命表相同,但取消了混合表。本次非养老金业务表男性平均寿命为76.7岁,较原生命表提高了3.1岁,女性平均寿命为80.9岁,较原生命表提高了3.1岁。养老金业务表男性平均寿命为79.7岁,较原生命表提高了4.8岁,女性平均寿命为83.7岁,较原生命表提高了4.7岁。

二、损失资料的收集

风险评估的第一步是收集数据。为寻找那些可能从过去损失中得到的未来损失模型,风险管理人员应尽力收集损失数据,这些数据要求具有完整性、一致性、相关性和系统性,并且数据的获取必须利用合理的财力和时间。

(一)完整性

完整性即收集到的数据尽可能充分、完整。这种完整不仅要求有足够的损失数据,而且要求收集与这些数据有关的外部信息。例如要分析火车出轨的原因,事故发生的时间、地点,当时乘务组的成员、货物的装载情况等都可能有助于我们分析损失发生的确切原因。当重要数据丢失时,风险管理人员必须依靠个人的洞察力和判断力来更新得到数据的内容。

(二)一致性

损失数据必须至少在两个方面保持一致: ①所有记录在案的损失数据必须在统一的基础上收集。在评估未来损失时,如果从不同的来源以不同的技术收集,可能会影响预测结果的准确性和有效性。②必须对价格水平差异进行调整,所有损失价值必须用同种货币来表示。调整的方法是确定某一时期(年或月)为标准时期,以此时期的价格水平为标准,其他时期的数据按标准时期的价格水平来调整。如果某一时期的价格水平较标准时期为低,则损失数据应相应调高,反之调低。调整过去损失数据的最好办法是提供每种损失的每个元素价格的独立增减额。

(三)相关性

相关性是指过去损失金额的确定必须以与风险管理相关性最大为基础。对于财产损失而言,应以修复或重置财产的费用而不是财产的原始账面价值作为损失值。对责任损失来说,损失不仅包括各种责任赔偿,而且包括调查、辩护和解决责任纠纷的费用。营业中断的损失不仅包括停工收入损失,还要包括在努力恢复营业至正常状态下的许多额外费用。

(四)系统性

收集到的各种数据不能直接使用,必须根据风险管理的目标与要求,按一定的方法进行整理,使之系统化,成为有用的信息。

三、损失资料的整理

当我们收集到了相关的损失数据后,如果不仔细审查,要说出它们具有什么样的特征、规律,是很困难的。因此,我们需要对这些杂乱无章的数据进行整理。

(一)降序排列(或升序排列)

把数据按不同大小的次序排列。例如,根据表3-1中的数据按照从小到大的顺序可排列成为表3-2。

表3-2 排序后的数据表 单位: 万元

经过对排列后的数据简单考察,现在可以明显地看出损失金额小于6万元的约占三分之一,并且损失额越大发生次数越少。但是要得出进一步的结论,我们还要继续研究这些数据。

(二)资料分组

资料分组法用于减缩资料。将损失数据的变动范围(如本例中的23.5-1.3=22.2)分为许多组(一般采用等组距)。资料分组首先必须决定要分多少个组。一般来说,如果数据个数大于50个,可分10~20组,如果数据小于50个,一般可分5~6组。

其次,要确定组距和组界。组距是指分组每组的宽度,一般可以用损失数据的变动范围除以组数,再相应的做出调整。组界具体是指每组的下界和上界,每个组的最大值为上界,最小值为下界。因此,组距=上界-下界。组界的精确度根据原始数据的精确度来确定,若原始数据的精确度为0.1,则组界的精确度为0.05。

在大多数情况下,组数少,组距大,将丢失太多的情况,以致不能充分揭示损失数据中内含的有用信息。如果组数过多,组距小,则在分析时,工作量增大,导致烦琐和浪费。在上述资料中数据变动范围是22.2,数据总数为35,可以分为5组,则组距为4.44,我们选为4.5。第一组从1.25开始,则分组如下:

1.25~5.75 5.75~10.25 10.25~14.75 14.75~19.25 19.25~23.75

最后,计算出组中值和组频数,做出频数分布表。组中值是指两个组界的中点,它是每组具有代表性的估计值。组频数是指数据落在该组中的次数。一般我们规定每组的左组界属于该组,而右组界归属下一组。频数与总个数之比,即为频率。将以上信息一起以表格的形式展现出来时,所得的表格就是频数分布表。

表3-3 某出租车公司每次事故损失频数分布表

(三)得出累积频数分布表

累积频数分布表是一个用以说明损失值在某特定数值以下的损失数据个数的表,因此各组对应的累积频数是该组及以前各组所有的组频数之和,也可以表示为:

第n组所对应的累积频数=第n-1组所对应的累计频数+第n组的组频数

表3-4是表3-2的累积频数分布表。

表3-4 某出租车公司每次事故损失累积频数分布表

练一练

下表为某化工厂1985—2004年火灾损失金额的原始数据(单位: 元):

表3-5

请对其进行整理。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈