首页 百科知识 样本规模与抽样误差

样本规模与抽样误差

时间:2022-03-11 百科知识 版权反馈
【摘要】:第五节 样本规模与抽样误差一、样本规模样本规模又称为样本容量,它指的是样本中所含个案的多少。确定样本规模也是每一项具体的社会研究所必须解决的问题之一。影响样本规模确定的第二个因素,就与这种推论的可靠性和精确性密切相关。在社会研究中,我们用置信度与置信区间这两个概念来说明样本规模与抽样的可靠性及精确性之间的关系。它是指在一定的置信度下,样本值与总体值之间的误差范围。
样本规模与抽样误差_社会调查与统计

第五节 样本规模与抽样误差

一、样本规模

样本规模又称为样本容量,它指的是样本中所含个案的多少。确定样本规模也是每一项具体的社会研究所必须解决的问题之一。统计学中通常以30为界,把样本分为大样本(30个个案及以上)和小样本(30个个案及以下)。之所以这样区分,是因为当样本规模大于30时,其平均值的分布将接近于正态分布,许多统计学的公式就可以运用,也可以用样本的资料对总体进行推论。但是,需要注意的是,30个个案的样本对于社会研究来说却常常是不够的。统计学中的大样本与社会研究中的大样本并不是一回事。

根据一些社会研究专家的看法,社会研究中的样本规模至少不能少于100个个案。这是因为,在社会研究中,研究者不仅仅需要以样本整体为单位来计算平均数、标准差、相关系数等统计量,同时,他们更经常地需要将样本中的个案按不同的指标划分为不同的类别,进而分析不同类别之间的差别,分析不同变量之间的关系。因此,要保证所划分出的每个子类别中都有一定数量的个案,就必须扩大整个样本的规模。比如,要计算某企业职工的平均收入,也许大于30个个案的样本就可以了。但是,如果要进一步计算不同年龄的职工群体(青年工人、中年工人、老年工人)的平均收入,那么,30个个案的样本显然就不能满足统计的需要。如果将样本中的个案按性别和年龄进一步划分为“青年男性、中年男性、老年男性和青年女性、中年女性、老年女性”六类,再分别计算每一类个案中的平均数、标准差时,所需的样本规模就更要成倍地增加了。

许多书中都给出了样本规模的计算公式。例如,简单随机抽样中推论总体均值的样本规模计算公式为:

img49(其中,t为置信度所对应的临界值;s为总体的标准差;e为抽样误差。)而推论总体人数(或百分比)的样本规模计算公式为:

img50

(其中,p为总体的成数或百分比;t,e含义同上。)

在上述计算公式中,t可从标准正态分布表中查出,e是研究者根据需要先确定的,但是总体的标准差、成数或百分比却往往是难以得到的(它们通常是研究所需求的)。因此,在实际抽样过程中,研究者往往无法直接运用上述公式计算所需的样本规模,而只能采取某种变通的办法。比如,利用前人所做的关于同一总体的普查或抽样调查资料,来计算或估计总体方差,由此得出推论总体均值的样本规模。在计算推论总体成数(或百分比)的样本规模时,我们注意到,p(1-p)在p=0.5时,达到最大值。因此,即使我们对p一无所知,也可以采取比较保险的办法,取p=0.5,这样,p(1-p)=0.25= 1/4,上式变为:

img51

它可以保证样本规模足够大。表5-10就是根据上面的公式所计算出的,在95%的置信度(t=1.96)的条件下的最小样本规模(表中为计算简便,取t=2)。

对于实际采用的复杂抽样,要达到同样的精度,需要乘上它的设计效应deff(Design Effect,被定义为任意抽样方式下的抽样方差除以简单随机抽样方式下抽样方差的商)。根据经验,通常取设计效应为1.8或2,当然也可以取2.5等。deff取得越大时,实际样本的规模也就越大。比如,表5-7中5%的抽样误差所要求的样本规模是400,而取设计效应为1.8时的实际样本规模则是400×1.8=720,设计效应为2时的实际样本规模就成了400×2=800。

二、影响样本规模确定的因素

一般情况下,社会研究中样本规模的确定主要受到以下四个方面因素的影响:(1)总体的规模。(2)估计的精确性要求。(3)总体的异质性程度。(4)研究者所拥有的时间、经费和人力。

表5-10 95%置信水平下不同抽样误差所要求的样本规模[5]

img52

1.总体的规模

样本规模与总体规模有关,这不难理解。按一般的想法,总体越大时,则样本也要越大。这样才能保证一定的精确度。但是,这种想法只在一定的程度上是正确的。当总体规模大到一定程度时,样本规模的增加与它并不保持同等的增长速度。图5-9表明,在其他有关因素一定时,样本规模的增加速度大大低于总体规模的增加速度。换句话说,当总体规模达到一定程度时,样本规模的改变量是很小的。

img53

图5-9 不同的总体规模所需要的样本量(相对于95%的置信度、±3%的置信区间和总体值以50%对50%的比例均分的假定而言)[6]

2.抽样的精确性

抽样的目的往往是要从样本去推论总体。影响样本规模确定的第二个因素,就与这种推论的可靠性和精确性密切相关。在社会研究中,我们用置信度与置信区间这两个概念来说明样本规模与抽样的可靠性及精确性之间的关系。置信度又称为置信水平,它指的是总体参数值落在样本统计值某一区间的概率,或者说,总体参数值落在样本统计值某一区间中的把握性程度。它反映的是抽样的可靠性程度。比如,置信度为95%,指的是总体值落在样本值某一区间的概率为95%。或者说,在对某一总体进行的同样形式的100次抽样中,总体值将有95次落在样本值的某一区间内。一般来说,在其他条件一定的情况下,置信度越高,即推论的把握性越大,则所要求的样本规模就越大。比如,99%的置信度所要求的样本规模,就比95%的置信度所要求的样本规模要大。

上面在探讨置信水平时所说的“某一区间”,叫做置信区间。它是指在一定的置信度下,样本值与总体值之间的误差范围。它所反映的是抽样的精确性程度。范围越大,精确性程度越低;范围越小,精确性程度越高。在其他条件一定的情况下,置信区间越小,即样本值与总体值之间的误差范围越小,则所要求的样本规模就越大。比如,对一个总数为20000的总体,当置信度确定为95%时,若置信区间为±5%,则需要377个回答者;若置信区间为±4%,则需要583个回答者;而置信区间为±1%时,则需要6849个回答者。换句话说,此时的样本规模已相当于总体规模的1/3。

3.总体的异质性程度

总体的异质性程度对所需样本规模的影响也十分明显。总体中成员相互之间不存在差别时,只要了解其中之一就行了,这当然是极端的情况。一般来说,要达到同样的精确性,在同质程度高的总体中抽样时,所需要的样本规模就小一些;而在异质程度高的总体中抽样时,所需要的样本规模就大一些。其主要原因是,同质性越高,表明总体在各种变量上的分布越集中,波动性越小,同样规模的样本对总体的反映就越准确;而异质性程度越高,表明总体在各种变量上的分布越分散,波动性越大,同样规模的样本对总体的反映就会越差。比如,当总体中的个体在收入上的差别比较小,或者说分布比较集中时,所抽取的样本中人均收入值的随机变动就很小,因而抽样误差也就会很小。抽样的精度就会比较高。

与总体异质性程度有关的另一个因素是,当总体中的大部分成员对某个问题的回答或选择与小部分成员的回答或选择不同时,比如,70%的成员选择甲,30%的成员选择乙,则所需要的样本规模要小一些;而当选择两种不同回答的成员比例相差无几时,比如,选择甲、乙的比例都为50%左右,则所需要的样本规模为最大。表5-11反映的就是这种差别。

表5-11 根据总体同质性程度和精确性要求所需要的样本规模[7]

img54

注:1.置信水平为95%;

  2.样本规模小于表中短横线上的数字时,难以进行有意义的分析。

4.研究者所拥有的时间、经费和人力

除了以上几种因素外,研究者所拥有的时间、经费和人力,也对样本规模的大小产生影响。从样本的代表性、抽样的精确性考虑,则样本规模当然是越大越好;但抽样所得到的样本是要用来进行调查的。样本规模越大,同时也意味着所需要投入的时间、经费和人力越多;意味着所可能受到的限制和障碍也越多。因此,从抽样的可行性、简便性考虑,样本规模又是越小越好;究竟选择多大规模的样本,往往需要作出选择。而这种选样的一个重要砝码,就是研究者所拥有的时间、经费和人力。

三、样本规模与抽样误差

抽样误差就是用样本值去估计总体值时所出现的误差。它是由于抽样本身的随机性所引起的误差。无论采取什么样的抽样方式,这种误差都是不可避免的。但是,在另一方面,抽样误差的大小是可以在样本设计中事先进行控制的。除了抽样误差以外,社会研究中还存在另一种误差,即度量误差,它是指在记录、填答、汇总等工作中所出现的误差。

抽样误差主要取决于总体的分布方差和抽样规模,这两个因素都可以导致抽样误差的增加或降低。当样本规模增加时,样本统计量的随机波动程度就会降低,从而使抽样误差也降低。在简单随机抽样中,人们正是以扩大样本规模的方式来达到降低抽样误差的目的。而分层抽样则是着眼于缩小总体的异质性程度或分布的方差,即通过将总体划分为不同的类别或层次,既使得这些不同类别或层次在样本中都有代表性,又使得抽样误差中不存在层间变差成分,而只存在层内变差成分,其效果相当于降低了总体分布的方差,从而降低了样本统计量的随机波动程度,提高了样本统计量估计总体参数的精确度。

有关抽样规模与抽样误差之间的关系问题,我们还应该注意两点:(1)对于比较小的样本来说,样本规模上的很小的一点增加,便会带来精确性方面很明显的增加。比如,在表5-10中,当样本规模从100增加到156时(仅仅增加了56个个案),抽样误差就由10%下降到8%。(2)而对于比较大的样本来说,同样增加这么多个个案,却收效甚微。比如,要使抽样误差从2%下降到1.5%,则需要增加2000个个案。因此,许多公司通常将它们的样本规模限制在2000之内,因为当样本规模超过了这一点时,花费在所增加的样本规模上的人力、物力,相对于增加估计的精确性来说,就有些得不偿失了。

本章小结

抽样指的是从组成某个总体的所有元素的集合中,按一定的方式选样或抽取一部分元素(即抽取总体的一个子集)的过程,或者说,抽样是从总体中按一定方式选择或抽取样本的过程。抽样的目的之一,就是要通过这些样本值去估计和推断各种总体值。抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现“由部分认识总体”这一目标的途径和手段。

各种抽样都可以归于概率抽样与非概率抽样两大类中;这是两种有着本质区别的抽样类型。概率抽样是依据概率论的基本原理,按照随机原则进行的抽样,因而它能够避免抽样过程中的人为误差,保证样本的代表性。而非概率抽样则主要是依据研究者的主观意愿、判断或是否方便等因素来抽取对象,已不考虑抽样中的等概率原则,因而往往产生较大的误差,难以保证样本的代表性。

所谓随机抽取,就是保证总体中的每一个个体都有同等的机会入选样本。或者说,总体中的每一个成员被抽中的概率相等(也即被抽中的机会相等)。

抽样的一般程序包括下列几个步骤:(1)界定总体。(2)制定抽样框。(3)设计抽样方案。(4)实际抽取样本。(5)评估样本质量。

常用的概率抽样方法包括:简单随机抽样、系统抽样、分层抽样、整群抽样、多段抽样。

按照Kish的户内抽样方法抽取被访对象的好处是,它不仅可以使研究者收集到样本家庭的资料,同时也可以收集到由这些被访者所构成的个人样本的资料,这种资料可以用来描述这一地区所有成年人所构成的总体。

社会研究中最重要,也最常用的一种不等概率抽样叫做“概率与元素的规模大小成比例的抽样”,简称PPS抽样。

一个优秀的抽样设计应该满足下列四条标准,也是进行抽样设计的四条原则,它们是:(1)目的性原则。(2)可测性原则。(3)经济性原则。(4)可行性原则。

一般情况下,社会研究中样本规模的确定主要受到以下四个方面因素的影响,即总体的规模、估计的精确性要求、总体的异质性程度、研究者所拥有的时间、经费和人力。

关键术语

总体 样本 抽样 抽样框 抽样单位 参数值 统计值

置信度 置信水平 简单随机抽样 系统抽样 分层抽样 整群抽样 多段抽样 PPS抽样 偶遇抽样 判断抽样 定额抽样

雪球抽样 样本规模 抽样误差

思考题

1.什么是抽样中的随机性?为什么概率抽样的方法能够保证样本对总体的代表性?

2.抽样设计的基本原则是什么?

3.分层抽样与整群抽样的具体操作方法是怎样的?二者之间有何异同?什么情况下应选用分层抽样?什么情况下则应选用整群抽样?

4.如果条件允许,多段抽样中应尽可能扩大哪一级样本的规模?为什么?

5.在实际社会调查中,有哪些因素影响到研究者对样本规模的确定?

6.某市有300所小学,共240000名学生。这些小学分布在全市5个行政区内,其中重点小学有30所,一般小学有240所,较差的小学有30所。现要从全市小学生中抽取1200名学生进行调查,以了解全市小学生的学习情况。请设计一种抽样方案。

7.从社会科学期刊中选择三篇研究报告,分析并评价这些研究中所采用的抽样方法。

【注释】

[1]“How the Poll Was Conducted”.New York Times,October 15,2008,PP.A22.[EB/ 01].http://www.nytimes.com/2008/10/15/us/politics/15method.html.

[2][美]英克尔斯.从传统人到现代人.顾昕,译.北京:中国人民大学出版社,1992:63.

[3][美]英克尔斯.从传统人到现代人.顾昕,译.北京:中国人民大学出版社,1992:68.

[4][美]科什.抽样调查.北京:中国统计出版社,1997:25-28.

[5]D.A.DE VAUS.Surveys in Social Research.Goerge Allen & Unwin Ltd,1986:63.

[6][美]林南.社会研究方法.北京:农村读物出版社,1987:182.

[7]D.A.DE VAUS.Surveys in Social Research.Goerge Allen & Unwin Ltd,1986:65.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈