假设检验和计量经济模型

时间：2022-11-18 理论教育版权反馈

【摘要】：会计上，实证分析对象主要是与财务报告信息相关的一些经济和政治活动。假设检验就是根据样本信息来判断“总体”分布趋势是否具有某指定特征。假设检验属于统计推断，它是指根据概率论随机变量的一般规律性，利用抽样调查获得的“部分”样本资料，对“总体”某些性质或数量特征进行的一种推断。本章主要阐述假设检验的基本推断问题。

第二节　假设检验和计量经济模型

一、假设检验的意义和基本思想

（一）统计假设

实证研究的对象必须是有价值、重要的问题，并能将问题转化为可以检验的假说（或假设）。该假说可转化为统计假设并可以经由数据收集、分析来加以检验。确认研究问题、提出研究假说（或假设）、进行研究设计、收集样本数据、进行统计分析，并解释结果，这是经验研究的几个基本步骤。

统计上，假设是一种关于“总体”分布特征的预测论断，关于总体统计特征的假设，称为“统计假设”，简称“假设”。会计上，实证分析对象主要是与财务报告信息相关的一些经济和政治活动。对于活动“总体”的某些性质或数量分布特征，即总体趋势，往往并不真正掌握。但是，人们可根据以往经验或某些信息进行猜测或预测。按统计学观点，这种预测其实质就是预测某总体的平均数、总体的方差或总体中具有某特征的个体所占比例等，以及预测总体的分布是否与某已知分布相同等。这些关于总体分布特征的预测就是统计假设。在统计假设中，涉及总体分布所含未知参数的假设称为参数假设；涉及总体分布形式的假设称为非参数假设。

（二）假设检验及其基本思路

根据样本观察值判断有关总体的假设是否成立的问题，就是假设检验问题。假设是否正确，必须通过对假设进行检验。假设检验就是根据样本信息来判断“总体”分布趋势是否具有某指定特征。假设检验属于统计推断，它是指根据概率论随机变量的一般规律性，利用抽样调查获得的“部分”样本资料，对“总体”某些性质或数量特征进行的一种推断。统计推断依据“部分”推断“总体”，这种推断必定带有一定程度的不确定性，因此须用概率来表示推断“可靠度”。概率是指随机事件发生可能性的大小，用0～1的小数或百分数表示，它可分为古典概率、试验概率和主观概率。

古典概率是可以用演绎方法计算得到的概率，试验概率是用统计试验的大量数据计算的频率近似表示的概率，而主观概率是凭经验主观估计的概率。在经济问题决策中，往往使用主观概率。统计推断主要包括参数估计和假设检验，前者侧重用样本统计量估计总体的某未知参数；后者侧重用样本资料验证总体是否具有某种性质或数量特征。本章主要阐述假设检验的基本推断问题。

我们可用小概率原理来解释假设检验的基本思想，其中小概率事件是指在一次试验中几乎不可能出现的事件。小概率原理认为，在一次试验中小概率事件几乎是不可能出现的。如果对总体的某假设是真实的，那么不利于或不支持该假设的事件在一次试验中几乎是不可能发生的（它是小概率事件）；要是在一次试验中事件发生了，按证伪的原则就有理由怀疑该假设的真实性，从而拒绝该假设。在检验总体分布的假设中，至少可提出两个对立的假设：一是原假设；二是备择假设，两者有且只有一个正确。备择假设的意义在于，一旦否定原假设，备择假设备作选用。一般，假设检验就是判断原假设是否正确，决定接受还是拒绝原假设，若拒绝原假设，就接受备择假设。

假设检验不是简单地根据样本结果直接判断原假设与备择假设谁更正确，其实质是对原假设是否正确采用证伪方法进行检验。由于样本具有局部性和随机性，仅凭一次试验的结果否定原假设，可能发生弃真的错误；反之，如果错误接受原假设，则可能发生取伪的错误。统计上将发生弃真错误的概率记为α，称为显著性水平。在假设检验中，根据显著性水平便可确定接受还是否定原假设的界限。有了这种界限，检验中就可使原假设得到一定的“维护”，不至于被轻易否定，否定原假设必须有充分的理由，以此来确保备择假设的正确性。这就是所谓的“精致证伪主义”哲学思想在假设检验中的一定体现。

在实际研究中往往将待检验的研究假说作为备择假设，而将它的对立面作为原假设接受统计检验。如果在较高的显著性水平（如5%）下拒绝原假设，说明若原假设正确则只有5%的可能会出现样本所带来的结果，因此可以说在95%（1－5%）的置信度下原假设是错误的；应该接受备择假设也即说明研究假说是正确的。之所以在假设检验中将研究假说的对立面作为统计假设进行检验，就是为了在统计检验中“保护”原假设（研究假说的对立面），从而增强在证伪原假设（接受备择假设）并证实研究假说时研究结论的可靠性。

二、假设检验的基础知识和方法

（一）常用统计量

统计量也称“估计量”，是指按样本计算的统计指标，也就是抽样指标或样本指标，如样本均值、中位数、方差等。根据统计量可以推断总体分布或有关特征数的可靠程度。

1．均值、中位数和众数。假设检验时须了解概率分布的一些数字特征如随机变量的均值。均值也称“数学期望”，它是对随机变量可能取值的一种“期望”。数学期望反映了变量可能取得的平均水平（也即平均数），是刻画变量性质的一个最重要的数字特征，其他重要的数字特征如方差等也是通过它来间接定义的。

在检验中，有时采用中位数作为变量的均值。中位数是将总体各单位的标志值按顺序排列，处于中间位置的标志值。中位数把数值一分为二，一半数值比它大，另一半数值比它小，因此它是一种位置平均数。相对于平均值，中位数可以排除极端值、异常值的影响。众数也是一种位置平均数，是指总体中出现次数最多的标志值，它能反映数据分布的集中程度，如某商品多数的成交价、多数家庭的人口数等。

2．极差、平均差和方差、标准差。总体各变量分布在平均水平周围，呈现一种集中趋势或离散趋势。集中趋势和离散趋势分别从两方面描述总体分布的特征，如上述均值反映了随机变量的集中趋势。测定离散趋势的指标称为标志变异指标，也称标志变动度。标志变异指标表明平均数的代表性，标志变异程度大，平均数代表性就小；反之，标志变异程度小，平均数代表性就大。

常用的标志变异指标有极差、平均差、标准差、方差等。其中，极差是指总体分布中最大值与最小值之差，它是一种最简单的反映总体分布离散程度的方法。极差从两个极端数值进行考察，忽略了中间数据变动情况，不能说明整体的差异程度。在有极端异常值的情况下，使用这种方法会得出错误结论。平均差是各变量与其平均数的绝对离差的算术平均数。方差是总体各单位标志值与平均数离差平方的均值，方差σ²＝∑（X－x^—）²／n。公式中，X为单位标志值；x^—为标志值的均值；n为样本量。标准差是方差的正平方根，也称均方差，其算式为σ＝

（X－x^—）²／n。平均差、方差和标准差反映了随机变量的离散程度。

3．协方差和相关系数。对二维随机变量（X，Y）来说，它们各自的均值反映了各自的平均取值，各自的方差反映了各自偏离均值的离散程度；但均值和方差都没有提供两变量间相互关系的信息。协方差是用来度量两个具有概率分布P（X_i，Y_j）的随机变量之间相关关系的指标。它是在考虑概率情况下X与Y变量离差乘积的数学期望。其算式为Cov（X，Y）＝∑［（X－X　—）（Y－Y　—）P（Xi，Yj）］，公式中X　—、Y　—分别是X、Y的均值，P（X_i，Yj）表示概率。

相关系数是反映随机变量X与Y线性相关程度的一个数字特征，或称为线性相关系数。其算式为ρXY＝。若ρXY＝0，称X与Y不相关；｜ρXY｜＝1说明X与Y有线性关系，称X与Y线性相关；｜ρXY｜＜1时这种线性关系随｜ρXY｜的减小而减弱。

（二）常见分布

概率分布是指根据随机变量所有可能取值及其对应的概率来对随机变量的变化进行描述的分布。它描述了随机变量的整体规律性，可以分为离散随机变量概率分布（离散分布）和连续随机变量概率分布（连续分布）。概率分布是统计推断的基础。

1．正态分布。理论研究表明，如果一个随机变量受到大量微小的、相互独立的随机因素的影响，则这个随机变量就服从正态分布（Normal　Distribution）。在实际问题中，有许多随机现象服从或近似服从正态分布。正态分布是统计中最重要、应用十分广泛的一种概率分布，也称常态分布、高斯分布。

正态分布的概率密度曲线f（x）具有以下特征：（1）曲线图形是一个关于直线X＝μ对称

的、单峰钟形曲线，其中μ是变量x的均值或数学期望，反映正态分布的中心位置和相应随机变量的集中位置；且均值、中位数、众数三者重合，均为μ。（2）f（x）在x＝μ处达到最大值，曲线从最高点出发往x轴正负两个方向下降，无限逼近x横轴。曲线与x横轴之间的面积等于1；曲线下，在μ－σ与μ＋σ之间的面积为0．683；在μ－2σ与μ＋2σ之间面积为0．955；在μ－3σ与μ＋3σ之间面积为0．997。（3）正态分布由参数μ和σ确定。σ²是方差，σ越小，曲线越尖、越高，分布越集中在x＝μ附近；σ越大，分布越平坦。

在正态分布族中，μ＝0和σ＝1的正态分布，称为标准正态分布。当变量X服从标准正态分布时，记作X～N（0，1）。在实际问题中，凡是处于控制状态的数据和测量随机误差分布，大多数近似认为其服从正态分布。由于正态分布应用极其广泛，因此许多教材都编有正态分布表以供查阅。

2．卡方分布（Chi－square　Distribution）也称Χ²分布。假如X服从标准正态分布N（0，1），则X的平方和）所服从的分布称为Χ²分布，记为X～Χ²（n）。

它是一种正态分布的派生分布，在统计检验中占有重要地位，许多实际分布都可以用它来近似。利用Χ²分布可进行方差估计和检验，以及非参数假设检验中的拟合优度检验和独立性检验等。

3．t分布（t　Distribution），又称学生氏分布。设随机变量X～N（0，1），Y～Χ²（n），且X、Y相互独立，则随机变量的分布称作自由度为n的t分布，记为T～t（n）。

它类似于标准正态分布，但t分布的方差大于1，与标准正态分布相比，其中心部分较低，两个尾部较高。随着自由度（一个样本的各项数值中可自由变动的项目个数）n的不断增大，t分布越来越接近标准正态分布，并以其为极限。利用t分布可进行总体方差未知时正态总体均值的估计和检验，以及线性回归系数的显著性检验等。

4．F分布（F　Distribution）。设随机变量X～Χ²（n），Y～Χ²（m），且X、Y相互独立，则随机变量称作自由度为（n，m）的F分布，记作F～F（n，m）。其概率密度曲线一般是右边尾巴拖得较长的“右偏态”（或“正偏态”）分布。利用它可进行两个正态总体方差的比较检验、方差分析和线性回归模型检验。

必须指出，SAS（Statistical　Analysis　System）、SPSS（Statistic　Package　of　Social　Science）等统计软件往往会显示一些指定的统计量或分布检验结果。

（三）大数定律和中心极限定理

极限定理是概率论的基本理论之一，它主要有大数定律和中心极限定理。大数定律，也称大数法则，其大意是随着样本量n的无限增大，样本均值将无限逼近于总体均值μ。如投掷一枚硬币，大量反复投掷时，出现正面的次数与总投掷次数的比值，必然接近1／2；其意义在于，当样本量足够大时事件发生频率与概率有较大偏差的可能性很小，频率近似等于概率。

中心极限定理是一个系列定理，人们把一切以正态分布为极限的定理均称为中心极限定理。中心极限定理认为，无论总体分布具有何种形式，只要样本容量n足够大，样本均值的抽样分布近似为正态分布。中心极限定理的重要性在于，即使不了解总体分布，但只要样本量够大，X　—的抽样分布就近似为正态分布，从而可以进行一系列的统计推断。

中心极限定理是数理统计的重要工具之一，应用该定理要求n应足够大。一般说，总体分布越接近正态分布，所需n就可越小；反之，所需n就要越大。统计上，往往将n≥30的样本称为大样本，并认为它具有中心极限定理所表明的性质；而将n＜30的样本称为小样本，认为它不具有大样本的性质。

（四）参数估计和假设检验

1．参数估计。参数估计一般包括点估计和区间估计。点估计是用样本的具体指标去估计总体的未知参数，它不能表明估计的可靠程度。评价估计量的准则有四个，即无偏性、有效性、一致性和充分性。区间估计也称置信区间，它是在估计参数的值时，通过样本观察按给定概率给出的一个范围，这个范围称为“置信区间”或称“置信域”。点估计优点是能给出一个明确值，缺点是没有指出这种判断把握有多大。相对于点估计，区间估计能以一定的置信度（概率）来保证统计估计的正确性。

例如，对总体的未知参数θ₀作出区间估计，估计在一定概率下θ₀在θ₁和θ₂之间，则可表示为P（θ₁≤θ₀≤θ₂）＝1－α。其中，θ₀为待估的参数，θ₁与θ₂分别为置信下限和置信上限，（θ₁，θ₂）为置信区间；“1－α”为置信度或置信概率，它是区间估计的可靠概率，表明区间估计的可靠性。它表明，这个区间包含θ₀的把握有100（1－α）%。α为显著性水平，表明区间估计的不可靠概率。有些实际问题，往往只关注未知参数在一定置信度下的上限θ₁或者下限θ₂，这样得出的置信区间称为“单侧置信区间”；而同时关注未知参数一定置信度上限和下限的，称为“双侧置信区间”。

2．假设检验。

（1）假设检验规则、两类错误和显著性检验。抽样调查中获得的样本源于总体，但根据“部分”样本进行假设检验并作出判断，就有可能犯错误。这种错误有两种：一是原假设H0本来正确应予以接受，但按检验规则却拒绝了H0，这类错误称为第Ⅰ类错误，也叫做弃真或拒真错误，其发生概率记作α；二是原假设H0本来不正确应予以拒绝，但按检验规则却接受了H0，这类错误称为第Ⅱ类错误，也叫做取伪或受伪错误，其发生概率记作β。

一般说，总是希望将犯这两类错误的概率控制在非常低的范围内。但在一定样本量下，α与β是此消彼长的：α减小会使β增大，β减小会使α增大。于是，美国数学家奈曼（Neyman）和英国统计学家皮尔逊（Pearson）提出如下原则：在控制犯第Ⅰ类错误概率不超过指定值α的条件下，尽量使犯第Ⅱ类错误的概率β小。其含义是H0要受到维护，使H0不被轻易否定。如前文所述，在实际研究中往往将研究假说的对立面作为原假设接受统计检验，而且须要“保护”原假设以增强研究结论的可靠性。在这种情况下需要主要控制的就是第Ⅰ类错误或弃真错误，也就是说要控制错误地推翻原假设而接受研究结论（备择假设）的风险。如果限制第Ⅰ类错误发生的概率不得超过正数α，则称α为显著性水平或检验水平。

根据这种只控制α而不考虑β的法则做出的假设检验，称之为“显著性检验”，它只考虑限制犯第Ⅰ类错误的概率。人们往往将概率小于一定比率的事件称为“小概率事件”，根据需要选择的常用α取值分别有：0．003，0．01，0．05，0．10等。例如，选择5%的显著性水平，则发生第Ⅰ类错误概率就是5%。在推断统计中，显著性水平α往往是事前给定的，如果犯弃真的错误损失大，可将α取值小些；反之，α取值大些。假定在5%的显著性水平下拒绝原假设，则说明错误地推翻原假设而接受研究结论的风险只是一种有5%可能性的小概率事件。

（2）假设检验的Z值和P值判断。假设检验的一般步骤为：①根据具体问题要求，建立H₁和H₀。②选择一个合适的检验统计量Z。根据H0和H1确定一个检验规则的形式。③给定适当的显著性水平α，当H0为真时，求出其相应的临界值，从而得出检验统计量Z值的拒绝区域和接受区域。④由样本观测值计算检验统计量Z值，按检验规则，对H0作出拒绝或接受的判断。

在假设检验中，统计量称为检验统计量，它是抽样指标或样本指标，如样本的平均数、方差和标准差等。根据统计量可推断总体分布或有关特性数的可靠程度。由于样本是随机抽取的，因而统计量也是随机变量。在一般经济问题检验中，α＝0．05时，Z＝1．96（或近似于2），表示在随机现象服从的正态分布中，拒绝区域面积为0．05。在检验中，如果检验统计量Z值大于1．96（或近似大于2），表明Z值落在拒绝区域。根据小概率原理，应认为原假设是不正确的，应予否定。

在实际检验中，也可运用计算出来的P值进行判断。人们往往将α定于0．05～0．01，并把伴随概率P值小于0．05的检验结果称为统计显著，而将P值小于0．01的检验结果称为高度显著。因此，这些伴随概率P值也称为观察到的显著水平。假定上述假设检验中，给定的α＝0．05，当P值＜0．05，则拒绝H0，接受H1；反之，当P＞0．05，则接受H0，拒绝H1。根据P值判断拒绝或接受H0的做法，与上述Z值判断做法相比，在给定的α情况下判断方式正好相反。当α＝0．05，Z值＞1．96时拒绝H0；等价地，P值＜0．05时拒绝H0。

（3）总体均值的假设检验。总体均值的假设检验，包括正态总体均值的检验和非正态总体均值的检验。当总体分布不服从正态分布时，根据中心极限定理，只要检验的样本量n＞30，在大样本情况下检验统计量Z的分布就近似标准正态分布，因而样本均值X的抽样分布近似正态分布。于是，假设检验的方法就可借鉴正态总体均值的检验方法进行。

三、计量经济模型的构造和种类

大量的实证会计研究是借助于数学模型进行分析的，这不仅须要选择变量，而且必须构造模型。如第一章所述，财务报告的计量观要求更多地披露财务会计公允价值信息，以此来增强财务报告信息的决策有用性。公允价值随时间变化而变化，尤其是金融衍生工具商品其现值与历史成本相差甚远，于是美国FASB发布准则要求采用资本资产计价模型来报告公允价值信息。人们开始怀疑资本市场是否如同人们早先认为的那样有效，历史成本基础的财务报告信息是否具有决策相关性，这促使研究者重视分析股票内在价值并把兴趣转移到各种动态资产公允价值计价模型的研究上来（详见第十二章介绍）。

用模型来进行研究的优点至少有三：（1）防止计算差错。由数学形式表达的模型可以避免直觉判断可能导致的差错。（2）使用统计方法所进行的估计可以提供在一定置信度下的置信区间。这就可以在一定把握下提供研究对象的可能范围。（3）可以对模型进行灵敏度分析，清楚某个参数变化对研究对象的影响。由于在建模中需要判断哪些解释变量可被选入模型，应选择哪种适用的函数形式，如何解释模型的统计拟合度，以及考虑模型预测结果对推定或解释目的的有效程度等因素，因此计量经济模型的构建是一项“科学”的工作，在某种程度上也可以说是一种“艺术”。

在分析中，当分析者对研究变量的影响因素知之甚少或一无所知，但能获得大量数据，而且模型主要用于短期预测时，通常会选择构建时间序列模型。然而，在已知一些信息情况下，分析者也可以构造多种类型的模型，并将它们的预测结果进行比较分析。实证研究中构建的模型往往有以下一些类型：（1）时间序列模型。这类模型反映变量过去的变动规律，并利用规律来预测未来变化，因此它实际上是一种高级的外推方法。当分析者对事项的预测过程本身知之甚少时，可采用这类模型进行预测。由于我们可假设对引起研究变量发生变化的原因一无所知，因此期望通过分析变量时间序列的过去行为来预测其未来行为。预测方法可能是如线性外推法的简单确定性模型，或是用于适应性预测的复杂随机模型。利用这类模型可推测以下事例，如利用过去趋势的简单外推法预测收入、盈利的增长、短期利率变化、股价变动，以及其他变量等。但时间序列模型结构有其局限性，因此它们只在短期间内是可靠的。（2）单方程回归模型。在这类模型中“因变量”由若干“解释变量”的单个函数所解释，其中单个函数可以是线性也可以是非线性的。但是，单方程模型并没有解释“解释变量”之间可能存在的相互依赖性，它只是从一个方向解释了变量之间的因果关系。也就是说，单方程模型的解释变量决定因变量，因变量与解释变量之间不存在反馈式关系。（3）多方程模型。在这类模型中，被研究的变量可能是若干解释变量的一个函数，这些变量彼此相关，同时也通过一组方程与被研究的变量相关。联立方程模型往往由一组回归方程构成，它可考虑多个变量之间的相互联系。模型不仅要确认每个关系，还要考虑所有相互关系的相互作用。一个四方程模型含有比4个单方程总和更多的信息，它不仅解释4个单个关系，也描述这4个关系同时作用所隐含的结构关系。构建一个多方程联立模型需要耗费大量时间和财力，研究者必须对分析事项的相关理论、背景资料和全部过程有深入了解，因此构造这类模型是十分不容易的。

模拟就是在一定的时间范围内对这些方程进行联立求解的过程。在构建模型时有时会使用到平行数据或称面板数据（Panel　Date），它是指横截面数据和时间序列数据的结合。比如，某一时点上各企业的财务指标是横截面数据，不同时期的某企业财务指标数据就是时间序列数据；不同时期的各企业财务指标是横截面数据和时间序列数据的“综合”，就是平行数据。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈