建模方法的运用

时间：2023-06-02 百科知识版权反馈

【摘要】：2.2.3　建模方法的运用财务预警建模方法主要包括指标预处理和模型建立两个步骤。在建模方法的选择上，本书没有去讨论人工智能或其他学科方法在财务危机预警领域的交叉使用，仍然使用了传统的计量经济学方法：多元判别分析和逻辑回归分析。

2.2.3　建模方法的运用

财务预警建模方法主要包括指标预处理和模型建立两个步骤。前文的叙述表明，任何一个步骤都可以通过多种方法来实现。下面分步骤简单介绍本书将要使用的建模方法。本书下述所有方法的计算都通过软件SPSS11.5实现。

1）指标预处理方法

由于可能影响企业财务状况的指标众多，在利用这些指标建模之前，必须要对这些纷繁复杂的指标进行筛选，这就是指标的预处理。不同的研究者在研究中分别采用了经验法、显著性检验法、逐步筛选法、复合法、信息提炼法、主成分分析法等各种方法对指标进行筛选。

在指标预处理方法上，本书主要选用了T检验、Mann－Whitney检验和主成分分析法。对于信息显著性筛选，国内外大多数文献运用T检验方法判断危机企业与正常企业的某个指标均值是否存在显著差异，进而筛选出建模预警的指标。但是这是建立在指标体系服从正态分布的基础上的，而对于很多不服从正态分布的指标，应采用Mann－Whitney非参数检验。由于财务指标是否服从正态分布至今仍没有定论，本书对指标间信息显著性检验将综合T检验和Mann－Whitney检验两种方法，对于某个特定指标，只要一种检验方法拒绝均值差异的假设，就认为该指标不具有信息显著性^［46］。

而在各类变量的组合模型中，由于涉及的变量较多，即使用T检验和Mann－Whitney检验筛选掉了一部分变量，但剩下的具有显著性的变量仍然较多，使模型仍较复杂。主成分分析是一种降维的方法，可以使模型中变量的数量减少，使模型得到简化。

下面简要介绍几种方法的基本原理及在本书中的使用。

（1）T检验^{［46，140］}

在大多数文献中，T检验是对来自正态分布总体的两个样本进行均值差异性判断的最为常用的方法。在使用T检验时，危机企业与正常企业两类样本方差相同与否将决定t值的计算方法。进行方差的检验一般使用F检验（Levene检验），对应的零假设是两组样本方差相等。如果P值小于0.05，说明在该水平上否定原假设，两组方差差异显著，即方差不相等，否则接受零假设，即方差相等。用u₁、u₂表示两个样本的均值，n₁、n₂表示两个样本的观测数目，s₁、s₂表示两个样本的标准差。F的计算公式如下

①当方差相等时，t值的计算公式如下

其中

②当方差不相等时，t值的计算公式如下

t统计量仍然服从T分布，但自由度采用修正的自由度

（2）Mann－Whitney检验^{［46，140］}

当预警指标体系不服从正态分布时，对两个样本均值差异性的判断应使用Mann－Whitney非参数检验。其步骤为将两组样本混合并由最小值到最大值排序，并将排序后的值从小到大依次赋予其顺序号1至n（n为混合后样本总容量），然后分别计算两组样本的序号和，并记为T₁和T₂，根据T₁和T₂计算Mann－Whitney检验统计量

其中，n₁、n₂分别为样本1和样本2的样本容量。选择U₁和U₂中较小者作为最终的检验统计量。对于两样本容量均大于30的大样本的Mann－Whitney统计量，对应的均值、标准差和Z统计量分别为

（3）主成分分析^［141］

主成分分析是利用降维的思想，在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。通常把转化生产的综合指标称为主成分，其中每个主成分都是原始变量的线性组合，且各个主成分之间互不相关，使得主成分比原始变量具有某更优越的性能。这样在研究复杂问题时就可以只考虑少数几个主成分而不至于损失太多信息，从而更容易抓住问题的主要矛盾，揭示事物内部变量之间的规律性，同时使问题得到简化，提高分析效率。

当预警模型涉及p个指标，分别用X₁，X₂，…，X_p表示，这p个指标构成的p维随机向量为X＝（X₁，X₂，…，X_p）′。设随机向量X的均值为μ，协方差矩阵为∑。

对X进行线性变换，可以形成新的综合变量，用Y表示，即新的综合变量可以由原来的变量线性表示，即满足公式（2.11）：

由于可以任意对原始变量进行上述线性变换，由不同的线性变换得到的综合变量Y的统计特性也不尽相同。一般将线性变换约束在下面的原则下：

①μ_i′μ_i＝1；

②Y_i与Y_j相互无关；

③Y₁是X₁，X₂，…，X_p的一切满足原则①的线性组合中方差最大者；Y₂是与Y₁不相关的X₁，X₂，…，X_p的所有线性组合中方差最大者；…，Y_p是与Y₁，Y₂，…，Y_p－1都不相关的X₁，X₂，…，X_p的所有线性组合中方差最大者。

基于上述三条原则决定的综合变量Y₁，Y₂，…，Y_p分别称为原始变量的第一，第二，…，第p个主成分。其中，各综合变量在总方差中占的比重依次递减。在实际研究中，一般只挑选几个方差最大的主成分，从而达到简化系统结构、抓住问题实质的目的。

在本书的研究工作中，挑选主成分的原则是：挑选前几个方差最大的主成分，其方差之和占全部方差的90%以上。

2）模型建立方法

模型建立方法，就是运用已有的指标体系，通过某种技术方法建立数学分类模型实现对待测样本的属性判断。从传统的单变量统计、多元判别分析，到逻辑回归、逻辑概率比回归，再到近些年的多元积和时间序列分析、神经网络分析、生存分析、案例推理等，预警建模存在着几十种不同的方法。其中，既包括传统统计技术，也包括新兴的智能计算技术，还有一些综合集成技术，但并非所有技术都得到了广泛的应用。

在建模方法的选择上，本书没有去讨论人工智能或其他学科方法在财务危机预警领域的交叉使用，仍然使用了传统的计量经济学方法：多元判别分析和逻辑回归分析。这样可以使本书的研究重点更明确，也就是侧重于预测变量选择视角问题。下面简要介绍本书对这两种方法的使用。

（1）多元判别分析^{［46，140］}

多元判别技术的主要目的在于判断一个个体所属的类别，即根据掌握的历史上每个类别的若干样本的数据信息，总结出客观事物分类的规律性，建立判别函数和判别准则，然后，当遇到新的样本点时，只需根据总结出来的判别函数和判别准则，就能够判别该样本点所属类别。判别分析包括距离判别、Bayes判别、Fisher判别、逐步判别等方法，本书将采用Bayes二类判别技术。

假设存在n个样本X₁，X₂，…，X_n，可以分为X^（1）和X^（2）两类，两类总体分别具有k维密度函数。其中，X^（1）类别的样本数目为n₁，X^（2）类别的样本数目为n₂，显然n＝n₁＋n₂。用D₁、D₂表示R^k的一个划分，且D₁∩D₂＝Φ，D₁∪D₂＝R^k。如果这个划分恰当，正好对应于样本x∈X^（i），若x落入D_i（i＝1，2），对于建立的划分（判别函数），求误判所带来的平均损失ECM最小。Bayes二类判别技术的主要步骤如下：

然后，建立判别函数

最后，对观测样本进行归类，判别规则为

当V^（1）（X）＞V^（2）（X）时，X∈X^（1）；当V^（2）（X）＞V^（1）（X）时，X∈X^（2）。

（2）逻辑回归^{［46，140］}

和多元判别技术相仿，逻辑回归（Logistic）的目的也是对个体所属的类别做出判断，逻辑回归更适合于二类判别，根据掌握的若干样本和对应类别的信息，通过Logistic变换建立回归函数和判别准则。当遇到新的样本点时，根据判别准则可以明确样本点所属类别。本书所采用的逻辑回归计算运用统计软件SPSS11.5实现。

假设存在n个样本X₁，X₂，…，X_n，可以分为X^（1）和X^（2）两类，两类总体分别具有k维密度函数。其中，样本属于X^（1）类别的概率为p，显然，样本属于X^（2）类别的概率则为（1－p）。可以依据Logistic变换建立因变量与各维度自变量的回归模型如下：

逻辑回归采用极大似然估计，在得出了模型的参数α、β后，将观测样本X代入下面的公式进行类别判断

判断规则如下：

当p＞0.5时，X∈X^（1）；当p＜0.5时，X∈X^（2）。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈