首页 理论教育 风险可视化

风险可视化

时间:2022-11-15 理论教育 版权反馈
【摘要】:无论是正 3 万日元的偏差,还是负 3 万日元的偏差,与平均值相差的程度是相同的,所以相加之后和为零。营业额和偏差的单位都是“日元”。求出的结果被称为“标准差”,是风险量化的指标。法国餐馆的标准差为 6.01 万日元,拉面店的标准差为 2.75 万日元,法国餐馆的风险约为拉面店风险的两倍。以平均值为中心,有 68.3% 的数据集中在正负 1 个标准差范围内,有 95.5% 的数据集中在正负 2 个标准差范围内。

两家店平均每天的平均销售额都是 20 万日元。但每天营业额的偏差程度和预想一样,差异很大。将营业额绘成图像就可以知道,法国餐馆每天的营业额偏差很大,而拉面店的营业额则比较平稳。

偏差就是不确定性,也就是风险。法国餐馆的风险是不是更高呢?我们可以试着计算一下。

标准差是用数值表示的各个数据与平均数的偏差。换句话说,也就是风险的量。

上一页的表格中,法国餐馆的营业额在开业当天比平均值高出 3 万日元,但第四天就比平均值低 10 万日元。

我们首先求出每一天营业额的偏差,再将各营业日的偏差相加,和为零。无论是正 3 万日元的偏差,还是负 3 万日元的偏差,与平均值相差的程度是相同的,所以相加之后和为零。

将各偏差的平方相加,再除以数据的个数,得出的数值称为“方差”。法国餐馆的方差为 36.15,拉面店的方差为 7.59。

方差本身也是表示风险的量的指标,但使用起来有些不方便。原因在于,对于方差我们直观上比较难以理解。

我们来看一下数字的单位。营业额和偏差的单位都是“日元”。方差是由偏差的平方得出的,所以单位是“日元的平方”,我们平时没见过这个单位,不太容易理解。

下面,我们试着求方差的平方根,使单位“日元的平方”回归到“日元”。求出的结果被称为“标准差”,是风险量化的指标。法国餐馆的标准差为 6.01 万日元,拉面店的标准差为 2.75 万日元,法国餐馆的风险约为拉面店风险的两倍。

我们试着再进一步深入思考标准差的含义。在统计学中,1 个标准差称为 SD(Standard Deviation),符号为σ(sigma)。笔者在此不进行数学方面的说明,我们只需要知道很多统计数据都是呈正态分布的,在一个标准正态分布中,数字出现的概率是固定的。以平均值为中心,有 68.3% 的数据集中在正负 1 个标准差范围内,有 95.5% 的数据集中在正负 2 个标准差范围内。

通过观察,我们就会发现本例遵循这样的规律。法国餐馆营业额的 1 个标准差为 6.01 万日元,20 万日元加正负 6.01 万日元计算后可知,20 天的数据中,有 70% 集中在 13.99 万至 26.01 万日元区间。我们实际确认,会发现有 14 天的数据在 13.99 万至 26.01 万日元范围内,14 除以 20 结果为 70%,和 68.3% 非常接近。

法国餐馆的标准差(单位:万日元)

拉面店的标准差(单位:万日元)

我们用同样的方法计算拉面店的数据,可知拉面店营业额 1 个标准差的范围为 17.35 万至 22.75 万日元。确认数据数值可知,有 14 天的数据在 17.35 万至 22.75 万日元区间内,14 除以 20 为 70%,也很接近 68.3%。

计算出的数值不是 68.3%,是因为选取的数据只有 20 个,实在太少了。如果样本够大,就会非常接近 68.3%。

知道了标准差有什么用呢?虽然无法准确知道下一次出现的数据,但我们可以提前知道“数据落在这个范围内的概率大致是多少”。

假设法国餐馆继续经营下去。虽然我们没有办法清楚预测明天的营业额是不是比 20 万日元要高,可我们能够预计有三分之二的可能在 13.99 万至 26.01 万日元的范围内。

顺便一提,在统计学中,落在 1 个标准差范围内的数据被视为“寻常的、普通的”,落在 2 个标准差范围外的数据被视为“特别的、异常值”。用法国餐馆的例子来说,日营业额不满 7.98 万日元或者超过 32.02 万日元都是异常的、特别的情况。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈