首页 百科知识 假设检验涉及的问题

假设检验涉及的问题

时间:2022-03-18 百科知识 版权反馈
【摘要】:为了更好地理解假设检验,我们对检验过程中涉及的几个问题作进一步的讨论.(1)两类错误.用假设检验进行统计推断所得到的结论不可能绝对正确,即最后作出的判断可能犯错误,我们的任务是将犯错误的概率控制在一个较低的水平上.在假设检验中发生的错误有两类:第一类错误,即拒绝一个本来是真实的原假设H0,其概率用α表示,称α为假设检验的显著性水平.这类错误可简称为弃真错误.第二类错误,即接受一个本来不真实的原假设
假设检验涉及的问题_统计中的智慧

为了更好地理解假设检验,我们对检验过程中涉及的几个问题作进一步的讨论.

(1)两类错误.用假设检验进行统计推断所得到的结论不可能绝对正确,即最后作出的判断可能犯错误,我们的任务是将犯错误的概率控制在一个较低的水平上.在假设检验中发生的错误有两类:

第一类错误,即拒绝一个本来是真实的原假设H0,其概率用α表示,称α为假设检验的显著性水平.这类错误可简称为弃真错误.

第二类错误,即接受一个本来不真实的原假设,其概率用β表示.这类错误可简称为取伪错误.

在例1的条件下,犯两类错误的概率α与β的对应关系如表6.2所示.

表6.2 例1中两类错误的概率

由表6.2可见:在样本量不变的条件下,要使α小,必然会导致β增大;要使β小,必然会导致α增大.要使得α和β都小,就必须增大样本量,而这在实际工作中有时却很难办到.由于计算β的值比较困难,所以在实际操作中,常常通过适当控制α来制约β.

在实践中,企业领导人往往根据犯两类错误的代价大小,来选择适当的显著性水平.在对一批化工产品进行检验时,如果犯第一类错误,需要对这批合格的产品重新加工,并承担由此所花费的时间和资金;如果犯第二类错误,就会使这批不合格的产品当作合格产品接受,从而让使用这批化工产品的全部用户冒遭受毒害的巨大风险.两害相比取其轻.在这个假设检验中,企业领导人宁可犯弃真错误,而不能犯取伪错误,因此会选择一个相当高的显著性水平α,以求得一个较低的β.

在对另一批产品进行检验时,如果犯第一类错误,就要拆除生产该产品的全部机器,安装新的生产设备,需要耗费巨额资金;如果犯第二类错误,只要通过代理人支付一笔数额不大的保修费.因此,企业领导人这时更愿意选择犯第二类错误,即取伪错误,从而在假设检验中选择一个较低的显著性水平α,以求得一个较高的β.

(2)显著性水平.在例1的检验过程中出现的显著性水平α=0.05该如何理解呢?它意味着在原假设H0正确时,样本统计数与假设的总体均值μ之间差异过大者,每100个样本中不应超过5个.如果样本统计数与总体均值间的差异过大,超过5%这个限度,就认为这个样本不可能取自假设总体,因此拒绝原假设H0.

图6.2形象地说明了α=0.05水平的显著性.在0.95的面积中,样本统计数与假设的总体均值之间没有显著的区别.而余下的0.05面积的两侧阴影区域代表了存在显著差别的部分.

需要强调指出的是,即使样本统计数落在0.95面积的非阴影区域,也并不证明原假设H0是真实的.因为能够证明原假设真实的唯一途径是我们知道总体均值.遗憾的是,这无法做到.因此,每当我们说接受原假设时,其真正的含义是我们没有充分的统计证据去拒绝它.在统计的语言中,“接受”这个词只不过是“不拒绝”的代用词而已.

图6.2 显著性水平α=0.05的说明

在假设检验中,人们需根据具体情况而采用不同的显著性水平.经常用的显著性水平是α=0.05,有时也用α=0.10,α=0.01等.表6.3列出的是显著性水平α与相应的临界值c的对应关系.

表6.3 例1中显著水平与对应的临界值

由表6.3可见,随着显著性水平α的不断增大,临界值c越来越小.因此在同样的检验中,若改变显著性水平α,会影响假设检验的判断结果.在例1中,如果将显著性水平α从0.05减小到0.01,由表6.3可知,这时拒绝域的临界值为

于是拒绝域缩小为W=﹛|z|≥2.576﹜,减少了拒绝原假设发生的可能性.由于|z0|=|-2.5|=2.5<2.576,不在拒绝域W内,不能拒绝原假设H0,因此应认为当日生产正常.仅仅因为选择了不同的显著性水平,就得到了与α=0.05时不同的结论.

从图6.3可以更加直观地看到,对于例1,当显著性水平α从0.05减少到0.01时,相应的拒绝域(图中两侧的阴影区域)也随之减小,于是样本统计数z0虽然在图(a)中落入拒绝域,但是在图(b)中却未落入拒绝域.

(3)双侧检验与单侧检验.在假设检验过程中,对于同一个原假设,可以作出3种不同的备择假设.我们仍以例1为例加以说明.

图6.3 不同显著性水平的假设检验

例1建立了两个假设:

原假设H0:μ=1.40;

备择假设H1:μ≠1.40,

其中备择假设μ≠1.40的含义是,当日生产化纤的平均长度过长或过短都是不合适的.备择假设H1位于原假设H0的两侧,构成双侧假设检验问题.

设用W表示拒绝域,则有W=﹛|z|≥c﹜,如图6.4(a)所示.

如果化纤的平均长度可允许过长,但是不允许过短,则可建立:

备择假设H′1:μ<1.40.

这个备择假设位于原假设H0的左侧,构成左侧假设检验问题.

设用W′表示拒绝域,则有W′=﹛z≤c′﹜,如图6.4(b)所示.

如果化纤的平均长度可允许过短,但是不允许过长,则可建立:

备择假设H″1:μ>1.40.

图6.4 3种检验的拒绝域

这个备择假设位于原假设H0的右侧,构成右侧假设检验问题.

设用W″表示拒绝域,则有W″=﹛z≥c″﹜,如图6.4(c)所示.

左侧假设检验和右侧假设检验可统称为单侧假设检验.

单侧检验与双侧检验一样,当样本统计数落入拒绝域时,则拒绝原假设H0,否则就接受原假设.

在进行假设检验时,如何选择双侧检验和单侧检验,应当根据实际需要来确定.设某个灯泡制造厂需要生产平均寿命μ=1500h的电灯泡.如果寿命太短,将会失去市场销路,如果寿命过长,就要加粗灯丝,从而增加灯泡成本.为了观察灯泡生产过程是否正常,检验人员从产品中抽取一个样本,作出假设检验H0:μ=1500;H1:μ≠1500;采用双侧检验.样本灯泡的平均寿命高于或低于1500h过多,都应拒绝原假设.

设有一个大学,从上述工厂购买一大批灯泡.当灯泡到达时,采购人员抽取一个样本进行检验,决定是否接受到货.当样本灯泡的平均寿命低于1500h时,采购人员就会拒绝接受到货;如果样本灯泡的平均寿命高于1500h,他肯定不会拒绝接受到货.因此,采购人员作出的假设是H0:μ=1500h;H1:μ<1500h;采用的是左侧检验.

(4)统计显著性与实际显著性.需要说明的一点是,在实施假设检验时,应注意统计显著性与实际显著性之间的区别.一个经过假设检验被拒绝的原假设意味着具有统计显著性,但是是否具有实际显著性,还应根据实际情况进行分析.特别是在大样本场合或精确测量场合常常会发生这样的情况:样本统计数与原假设之间哪怕只有很小的差异,都会被认为具有统计显著性,但是不一定具有实际显著性.

假设检验的种类很多,上面我们只是讨论了参数检验中的均值检验,借此可初步领略到统计学解决问题时独特而富有魅力的思维方式.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈