首页 百科知识 年报审计费用的方差分析与非参数检验

年报审计费用的方差分析与非参数检验

时间:2022-04-06 百科知识 版权反馈
【摘要】:如果没有显著的差异可以将三年的年报审计费用合并研究;反之,将三年的审计费用数据合并研究是有问题的,研究结论也是值得怀疑的。通过方差分析,分析不同水平的控制变量是否对结果产生了显著影响。对各年间审计费用是否由于年度的不同而不同进行检验,我们使用单因素方差分析。单因素方差分析实质上采用了统计推断的方法。由于方差分析的前提是各个水平下的总体服从于方差相等的正态分布。

4.3 年报审计费用的方差分析与非参数检验

4.3.1 年报审计费用的方差分析

4.3.1.1 2000—2002年三年间年报审计费用的方差分析

从图4-3可以看出,从2000年到2002年,国际五大合作所、国内五大所和国内其他所的平均年报审计费用逐年增加,从直观上看,增幅并不大,因此有必要进行方差分析,看看三类事务所三年间的平均审计费用是否有显著的差异。如果没有显著的差异可以将三年的年报审计费用合并研究;反之,将三年的审计费用数据合并研究是有问题的,研究结论也是值得怀疑的。

所谓方差分析(Analysis of variance,简称ANOVA)是对多个总体均值是否相等这一假设进行检验。方差分析的基本思路是:通过分析研究不同变量的变异对总变异的贡献大小,确定控制变量对研究结果影响力的大小。总变异分成两个部分,一是系统性变异,是控制变量造成的;一是随机性变异,是由于抽选样本的随机性而产生的。通过方差分析,分析不同水平的控制变量是否对结果产生了显著影响。如果控制变量的不同水平对结果产生了显著影响,那么它和随机变量共同作用,必然使得结果有显著的变化;如果控制变量的不同水平对结果没有显著的影响,那么结果的变化主要由随机变量起作用,和控制变量关系不大。

根据控制变量的个数,可以将方差分析分成单因素方差分析和多因素方差分析。单因素方差分析的控制变量只有一个(但一个控制变量可以有多个观察水平),多因素方差分析的控制变量有多个。对各年间审计费用是否由于年度的不同而不同进行检验,我们使用单因素方差分析。

单因素方差分析实质上采用了统计推断的方法。采用统计推断方法是计算F统计量,进行F检验。总的变异(或称离差)平方和计为SST,分解为两个部分:一部分由控制变量引起的离差,计为SSA(组间(Between groups)离差平方和);另一部分随机变量引起的SSE(组内(Within groups)离差平方和)。于是有:

SST=SSA+SSE

其中:

其中:k为水平数;ni为第i个水平下的样本容量。可见,组间样本离差平方和是各水平组均值和总体均值离差的平方和,反映了控制变量的影响。

组内离差平方和是每个数据与本水平组平均值离差的平方和,反映了数据抽样误差的大小程度。

F统计量是平均组间平方和与平均组内平方和的比,计算公式为:

从F值计算公式可以看出,如果控制变量的不同水平对观察变量有显著影响,那么观察变量的组间离差平方和必然大,F值也就比较大;相反,如果控制变量的不同水平没有对变量造成显著影响,那么,组内离差平方和影响就会比较大,F值就比较小。

本书用计量统计软件SPSS11.5来计算F统计值,F服从(k-1,n-k)个自由度的F分布,SPSS依据F分布表给出相应的相伴概率值。如果相伴概率值小于显著性水平α,则拒绝零假设,认为控制变量不同水平下各总体均值有显著差异;反之,则认为控制变量不同水平下各总体均值没有显著差异。

由于方差分析的前提是各个水平下的总体服从于方差相等的正态分布。其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的。所以,进行方差分析首先要进行不同水平下方差是否相等的检验,其零假设是各水平下总体方差没有显著差异。对于均值是否相等的检验,有很多方法,我们用LSD(Least-significant difference)即最小显著法。

下面是用SPSS11.5所做的方差分析结果。

(1)2000—2002年三年的全部观察值。

表4-14-1 Test of Homogeneity of Variances(方差同质性检验)

我们可以看到,相伴概率为0.18,大于显著性水平0.05,因此可以认为各年度样本组方差是相等的,满足方差检验的前提条件。

表4-14-2 ANOVA(方差分析)

从ANOVA结果表中可以看出,方差检验的F值为12.973,相伴概率是0.000。相伴概率小于显著性水平0.05,表示拒绝零假设,也就是说从2000年到2002年中至少有一年的年度审计费用与其他两年有明显的区别,也可能是三年的审计费用都存在显著的区别。

表4-14-3 Multiple Comparisons(多元比较)

续 表

*The mean difference is significant at the 0.05 level.

这是LSD法多重比较的结果。从该结果中可以看出三年之间的相伴概率都小于显著性水平,说明三年之间审计费用均值都存在显著差别。

(2)国际五大合作所。

表4-15-1 Test of Homogeneity of Variances(方差同质性检验)

我们可以看到,相伴概率为0.338,大于显著性水平0.05,因此可以认为各年度样本组方差是相等的,满足方差检验的前提条件。

表4-15-2 ANOVA(方差分析)

从ANOVA结果表中可以看出,方差检验的F值为0.296,相伴概率是0.745。相伴概率大于显著性水平0.05,接受零假设,也就是说从2000年到2002年中至少有一年的年度审计费用与其他两年没有明显的区别,也可能是三年的审计费用都没有显著的区别。

表4-15-3 Multiple Comparisons(多元比较)(LSD)

续 表

这是LSD法多重比较的结果。从该结果中可以看出三年之间的相伴概率都大于显著性水平,说明三年之间没有显著差别。

(3)国内五大所。

表4-16-1 Test of Homogeneity of Variances(方差同质性检验)

我们可以看到,相伴概率为0.742,大于显著性水平0.05,因此可以认为各年度样本组方差是相等的,满足方差检验的前提条件。

表4-16-2 ANOVA(方差分析)

续 表

从ANOVA结果表中可以看出,方差检验的F值为3.12,相伴概率是0.045。相伴概率小于显著性水平0.05,表示拒绝零假设,也就是说从2000年到2002年中至少有一年的年度审计费用与其他两年有明显的区别,也可能是三年的审计费用都存在显著的区别。

表4-16-3 Multiple Comparisons(多元比较)(LSD)

*The mean difference is significant at the 0.05 level.

这是LSD法多重比较的结果。从该结果中可以看出2000年的审计费用与2002年的审计费用有显著差别,但是2001年的审计费用与其他两年没有显著差别。

(4)国内其他所。

表4-17-1 Test of Homogeneity of Variances(方差同质性检验)

我们可以看到,相伴概率为0.927,大于显著性水平0.05,因此可以认为各年度样本组方差是相等的,满足方差检验的前提条件。

表4-17-2 ANOVA(方差分析)

从ANOVA结果表中可以看出,方差检验的F值为9.392,相伴概率是0.000。相伴概率小于显著性水平0.05,表示拒绝零假设,也就是说从2000年到2002年中至少有一年的年度审计费用与其他两年有明显的区别,也可能是三年的审计费用都存在显著的区别。

表4-17-3 Multiple Comparisons(多元比较)(LSD)

*The mean difference is significant at the 0.05 level.

这是LSD法多重比较的结果。从该结果中可以看出三年之间的相伴概率都小于显著性水平0.05,说明三年之间都存在显著差别。

4.3.1.2 行业间审计费用方差分析

我们对行业的划分以中国证监会公布的分类标准为依据,其中C类(制造业)按二级分类统计,其他按一级分类统计,共22类。因为有三年的数据,而且三年之间的审计费用有较大差异,我们分年来做,我们以2001年数据为例,来检验行业间审计费用是否存在显著差异。

表4-18-1 Test of Homogeneity of Variances(方差同质性检验)

我们可以看到,相伴概率为0.073,大于显著性水平0.05,因此可以认为各行业样本组方差是相等的,满足方差检验的前提条件。

表4-18-2 ANOVA(方差分析)

从ANOVA结果表中可以看出,方差检验的F值为1.502,相伴概率是0.068。相伴概率大于显著性水平0.05,表示不能拒绝零假设,也就是说2001年度各行业间的平均审计费用不存在显著的区别。

表4-18-3 Multiple Comparisons(多元比较)(LSD)

续 表

续 表

续 表

*The mean difference is significant at the 0.05 level.

说明:本表仅列示了行业之间显著性的差异,没有显著性差异的由于篇幅所限没有列示。

从表中可以看出,建筑业与信息技术产业的审计费用显著高于其他行业。除去这两个行业之外,其他行业的审计费用没有显著差别。

本书还对2000年和2002年各行业的平均审计费用进行了方差分析,由于篇幅所限没有列出,分析结果如下:通过对2000年数据的方差分析,我们发现建筑业与医药生物产业的审计费用明显高于其他行业。通过对2002年数据的方差分析,我们进一步发现,建筑业和造纸印刷业与其他行业有显著差别,建筑业的审计费用显著高于其他行业,而造纸印刷业的审计费用显著低于其他行业,而信息技术产业与其他行业的差别已不显著。

4.3.1.3 对年报审计费用的非参数检验

方差分析要求样本成正态分布,且方差相等,因此要求比较严格,从表4-9可以大概看出,样本组并不是标准的正态分布。与正态分布相比,大多呈现尖峰且右偏的类似正态分布。因此,我们有必要进行非参数检验。

所谓非参数检验,是对总体分布未知或无法确定的样本组进行一些一般性假设的统计性分析。非参数检验根据样本数目以及样本之间的关系可以分为:单样本非参数检验、两独立样本非参数检验、多独立样本非参数检验、两配对样本非参数检验、多配对样本非参数检验几种。我们要检验三类事务所之间、22类行业之间以及东部、中部和西部三类地区之间的审计费用是否存在差别,所以我们用多独立样本非参数检验方法。

多独立样本非参数检验分析样本数据是推断样本来自的多个独立总体分布是否存在显著性差异。多独立样本非参数检验一般推断多个独立总体的均值或中位数是否存在显著差异。多个样本之间是否独立,需要看在一个总体中抽取样本对其他总体中抽取样本是否有影响。如果没有影响,则认为这些总体之间是独立的。对于多独立样本非参数检验,我们主要做多独立样本的中位数检验和多独立样本的K-W检验。

多独立样本的中位数检验通过对多组数据的分析推断多个独立样本总体分布是否存在显著性差异。多独立样本的中位数检验的零假设H0为:样本来自的多个独立总体的中位数无显著差异。如果多组独立样本的中位数没有显著差异,或者说,多组独立样本有共同的中位数,那么这个中位数要处于每组样本的中间位置。本书仍用SPSS11.5来进行多独立样本的中位数检验。在SPSS实现的过程中,首先将多组样本数据混合并按照升序排列,求出混合样本数据的中位数,并假设它是一个共同的中位数。然后计算每组样本中大于或小于这个共同中位数的样本数。如果每组中大于这个中位数的样本数大致等于每组中小于这个中位数的样本数,则可以认为这多个独立总体的中位数没有显著差异。如表4-19所示,需要判断每列中上下格的值是否大致相同。

表4-19 多独立样本的中位数检验

SPSS将根据表4-19所示数据计算χ2统计量,计算公式如下:

其中:

i表示表4-19中的第i行;

j表示表4-19中的第j列;

Oij为第i行、j列的实际数目;

Eij为第i行、j列的数学期望值。

SPSS将计算列出χ2统计量对应的相伴概率值。如果相伴概率小于或等于显著性水平α,则应拒绝零假设,认为多个样本来自的总体中位数有显著差异;如果相伴概率大于显著性水平,则不能拒绝零假设,认为多个样本来自的总体中位数无显著差异。

多独立样本的K-W检验(是Kruskal-Wallis检验的缩写),是一种推广的平均秩检验。其零假设为:样本来自的多个独立总体的分布无显著差异。多独立样本的K-W检验的基本方法是:首先将多组样本数混合按升序排列,并求出每个观察值的秩,然后对多组样本的秩分别求平均值。如果各组样本的平均秩大致相等,则可以认为多个独立总体的分布没有显著差异。如果各样本的平均秩相差很大,则不能认为多个独立总体的分布无显著差异。K-W统计量的计算公式为:

其中:

公式右边k表示有k组样本;

ni表示第i组样本的观察之个数;

R为平均秩。

SPSS将自动计算K-W统计量,并依据K-W检验临界值表给出K-W统计量对应的相伴概率值。如果相伴概率小于或等于显著性水平α,则应拒绝零假设,认为多个样本来自的总体分布有显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设,认为多个样本来自的总体分布无显著差异。

(1)三类事务所之间的审计费用非参数检验。

表4-20 2000—2002年三类事务所之间的年报审计费用非参数检验

从表4-20中可以看出,无论是K-W检验,还是中位数检验,也无论是三年中的哪一年,所求出的相伴概率都远远小于显著性水平0.05,因此拒绝零假设,认为三类事务所之间的审计费用分布和中位数都存在显著差异。

(2)行业之间的审计费用非参数检验。

从表4-13可以看出,行业之间的审计费用是有差异的,但是差异显著吗?我们用非参数检验方法来进行检验。行业的划分以中国证监会公布的分类标准为依据,其中C类(制造业)按二级分类统计,其他按一级分类统计,共22类。

表4-21 2000—2002年三年间22类行业审计费用的非参数检验

从表4-21中可以看出,中位数检验三年的相伴概率均大于显著性水平0.05,可以接受零假设,认为各行业的中位数不存在显著差别。但是,K-W检验却得出了矛盾的结论,除了2000年外,相伴概率水平均小于显著性水平0.05,拒绝了零假设,认为在行业之间审计费用的分别有显著差别。由于行业划分比较细,从表4-13可以看出,审计收费最高的建筑业比审计收费最低的造纸印刷业高出77.27%。如果把最高的建筑业和最低的造纸印刷业去掉,那么检验结果又如何呢?

从表4-22可以看出,当把三年样本中建筑业和造纸印刷业去掉之后,所有的相伴概率都大于0.05,可以接受零假设,即各行业审计收费没有显著差别。那么建筑业与造纸印刷业之间审计费用为什么有那么大的差别呢?一个最可能的解释是两行业之间每家公司的资产有巨大差别,建筑业每家公司的平均资产为280411.77万元,而造纸印刷业每家公司的平均资产为161627.9万元,前者比后者高出73.50%,这与两者审计费用的差别大体相当。再者,对建筑业的审计特别是在建工程的核算盘点等工作要比造纸印刷业要复杂。

表4-22 三年间20类行业(除去建筑业和造纸印刷业)审计费用的非参数检验

(3)地区之间审计费用的非参数检验。

我们将地区按照传统分成三类,即东部地区、中部地区和西部地区。具体划分如下:

东部地区:京、津、沪、苏、辽、冀、鲁、浙、闽、粤、琼;

中部地区:黑、吉、晋、豫、鄂、湘、赣、皖;

西部地区:陕、甘、青、宁、新、川、渝、云、贵、藏、桂、蒙。

从表4-23中可以看出,无论是K-W检验还是中位数检验,相伴概率都显著小于0.05,因此拒绝零假设,可以认为东部、中部和西部地区在审计费用分布和三类地区审计费用中位数都存在显著差别。

表4-23 三年间东、中、西部三类地区审计费用的非参数检验

【注释】

[1]中国证监会首席会计师办公室编:《谁审计中国证券市场——审计市场分析(2000)》,中国财政经济出版社。

[2]由于在2001年国际“五大”所之一的安达信会计公司宣布退出审计行业,从2002年起,只有国际“四大”所之称谓,但由于本研究涉及2001年以前的数据,所以我们还是统称为国际“五大”所,其在国内的合作所,仍称之为国际“五大”合作所。如果称之为国际“四大”合作所,则是指2002年以后。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈