首页 百科知识 抽样分布指的是抽取的样本

抽样分布指的是抽取的样本

时间:2022-03-11 百科知识 版权反馈
【摘要】:概率抽样的方法可以帮助我们实现这一目标,并且可以对这种勾画的准确程度作出估计。在讨论概率抽样的问题时,应对有关放回抽样与不放回抽样的问题略作说明。抽样分布是根据概率的原则而成立的理性分布,它显示出:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。而根据概率统计理论,正态分布曲线下的任何部分
概率抽样_社会调查与统计

第三节 概率抽样

一、概率抽样的原理

为了理解概率抽样的原理或逻辑,我们需要对社会群体的同质性与异质性作一点探讨。社会是由不同的个人所组成的各种各样的群体、组织、阶层,等等,经常构成社会研究中的总体。如果某个总体中的每一个成员在所有方面都相同,那么,我们说这个总体具有百分之百的同质性,在这种情况下,抽样就没有必要了。因为只要了解其中的一个个体,就可以了解整个总体的情况。这当然只是一种十分极端的例子。现实社会研究中的绝大多数群体并不具备这种特征,相反,它们通常都存在着程度不同的异质性,即它们所包含的个体相互之间总是存在着这样或那样的差别,“世上没有两片完全相同的树叶”,现实社会中更没有两个完全相同的人。在各种社会总体都普遍存在异质性的现实面前,严格的概率抽样程序与方法就必不可少。而概率样本所要反映的正是总体本身所具有的那种内在的异质性结构。

抽样的最终目的在于通过对样本的统计值的描述来相对准确地勾画出总体的面貌。概率抽样的方法可以帮助我们实现这一目标,并且可以对这种勾画的准确程度作出估计。随机抽样(random selection)是这一过程的关键。所谓随机抽取,就是保证总体中的每一个个体都有同等的机会入选样本。或者说,总体中的每一个成员被抽中的概率相等(也即被抽中的机会相等)。而且,任何一个个体的入选与否,与其他个体毫不相关、互不影响。或者说,每一个个体的抽取都是相互独立的,是一种随机事件。为了理解事件的随机性与事件发生的概率之间的关系,最好的例子也许是投掷硬币。

对于投掷硬币的结果(总体)来说,只有正面和反面(个体)两种可能。每次投掷硬币相当于一次抽样过程(从两种可能性中抽取一种);这种抽样是随机的(两种可能性都可能出现,且出现的机会均等);尽管一次具体的随机抽样(一次投掷)只会有一种结果,或者出现某一种情况(正面或反面)的概率为100%;但是若干次不同的抽样的结果,却总是趋向于两种情况出现的次数各为50%——即趋向于两种不同结果本身所具有的概率,或者说趋向于总体内在结构中所蕴涵的随机事件的概率。这个例子告诉我们,在各种随机事件的背后,存在着事件发生的客观概率,正是这种概率决定着随机事件的发展变化规律。概率抽样之所以能够保证样本对总体的代表性,其原理就在于它能够很好地按总体内在结构中所蕴涵的各种随机事件的概率来构成样本,使样本成为总体的缩影。

在讨论概率抽样的问题时,应对有关放回抽样与不放回抽样的问题略作说明。严格地说,由于研究者在实际抽样中所做的基本上都是不放回抽样,因而并没有完全满足抽样的独立性要求。这种独立性要求指的是:任何一个元素的抽取都不会影响到其他元素被抽取的概率。然而,只要总体相对于样本来说要大得多,我们就可以忽略这种不放回抽样所产生的微小改变,因为事实上对于一个相当大的总体来说,缺少一个元素可以说基本上并不改变总体中其他众多元素被抽中的概率,同样的,即使将抽中的元素放回总体中,它也基本上不会有第二次被抽取的机会。

二、抽样分布

为了更好地理解概率抽样的原理,有必要对抽样分布作一简要介绍(更为详细的介绍可参见各种概率统计教材)。抽样分布是根据概率的原则而成立的理性分布,它显示出:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。

我们先来看一个总体为10个个案的平均数抽样分布。假如这10个人参加工作的年限分别为6年、7年、8年、9年、10年、11年、12年、13年、14年、15年,那么这一总体中的成员平均参加工作年限为10.5年。如果我们从总体中随机抽取一个人作为样本来估计总体的平均数,那么这种样本的估计可能是6~15年。全部可能的10个“样本”所得到的估计值可用图5-3表示。

img24

图5-3 容量为1的样本的抽样分布

当样本容量为2时我们总共可以抽取45个不同的样本(根据组合公式计算img25=10×9/(1×2)=45)。这些样本的平均数范围是6.5~14.5年,但其中会产生一些相同的平均数。比如,6年和14年、7年和13年、8年和12年、9年和11年这四个样本的平均数都是10年。图5-4中,10年那一列的四个点即是这四个样本的平均数。这45个样本的平均数分布见图5-4。

img26

图5-4 容量为2的样本的抽样分布

当样本容量增至3时,我们就会得到120个样本(img27=10×9×8/(1×2×3)=120)。这些样本的平均数范围是7~14年,其中相同的平均数更多。全部样本的平均数分布见图5-5。

img28

图5-5 容量为3的样本的抽样分布

当样本容量继续增大(越来越接近总体的1/2时),样本平均数的分布会进一步发生变化。这种变化趋势是:平均数的范围将逐步缩小(即底部越来越窄);相同的平均数会相应增多;全部平均数的分布向总体平均数集中的趋势也会越来越明显。从图5-6、图5-7中,我们可以很清楚地看到这种变化(它们分别是样本容量为4和5时的分布)。

img29

图5-6 容量为4的样本的抽样分布

这一定理说明:当n足够大时(通常假定大于30),无论总体的分布如何,其样本平均数所构成的分布都趋于正态分布。它的形状见图5-8。

img36

图5-7 容量为5的样本的抽样分布

img37

图5-8 正态分布图

img38(证明从略,详细的证明可参阅专门的概率与统计著作)。

更为重要的是,由于平均数的抽样分布是正态分布,其平均数的次数就是正态曲线下的面积。而根据概率统计理论,正态分布曲线下的任何部分的面积是可以用数学方法推算的。因此,任何两个数值之间的样本平均数次数所占的比例是可以求得的。比如,有68.26%的样本平均数在μ±SE这两个数值的范围内;类似地,大约有95%的样本统计值落在总体参数值正负两个标准误范围内,即μ±2SE;99.9%的样本统计值将落在总体参数值正负三个标准误范围内,即μ±3SE。在实际应用中,人们更多的是采用下列几个数字:

有90%落在μ±1.65SE之间;

有95%落在μ±1.96SE之间;

有98%落在μ±2.33SE之间;

有99%落在μ±2.58SE之间。

从反面来考虑这一结论,我们就会有以下推论:对于任何一次随机抽样来说,其样本的统计值落在总体参数值正负1.65个标准误之间的概率是90%;落在总体参数值正负1.96个标准误之间的概率是95%……我们正是在这种意义上来说明置信水平(或把握程度,如90%,95%等)与置信区间(估计范围)之间的关系。

三、抽样的一般程序

虽然不同的抽样方法具有不同的操作要求,但它们通常都要经历这样几个步骤:

1.界定总体

界定总体就是在具体抽样前,首先对从中抽取样本的总体范围与界限作明确的界定。一方面,这是由抽样的目的所决定的。因为抽样虽然只对总体中的一部分个体实施,但其目的却是为了描述和认识总体的状况与特征,是为了发现总体中存在的规律性,因此必须事先明确总体的范围;另一方面,界定总体是达到良好的抽样效果的前提条件。如果不清楚明确地界定总体的范围与界限,那么,即使采用严格的抽样方法,也可能抽取对总体严重缺乏代表性的样本来。

在这方面最为著名的例子是1936年美国总统大选的民意测验。总统选举投票前,《文摘》杂志寄出1000万张询问投票倾向的明信片,然后依据收回的200万份结果极其自信地预测共和党候选人兰登将以领先15%的得票率战胜民主党候选人罗斯福而当选总统。然而,选举结果使预测者们大失所望:获胜者不是兰登,而是罗斯福,并且其得票率反超过兰登20%!《文摘》杂志的声誉一扫而光,不久就因此而关了门。

究竟是什么原因导致《文摘》杂志的预测失败了呢?除了抽样方法上的非随机性以及邮寄方式上的原因外,对抽取样本的总体缺乏清楚的认识和明确的界定也是极为重要的原因。因为它当时抽样所依据的并不是美国全体已登记的选民名单,而是依据电话号码簿和汽车登记簿来编制抽样框,再从这些号码上进行抽取的。这样一来,那些没有家庭电话和私人汽车的选民就被排除在其抽样的总体之外了。而在当时,由于1933年开始的美国经济大萧条的影响,一方面,大量人口滑落到下等阶层;另一方面,此时的劳动阶层选民希望选个民主党人当总统,因而很多人都来投票。结果,这些未被抽到民意测验中的较穷的选民以压倒性优势多数地投了罗斯福的票,使《文摘》杂志的预测遭到惨败。

这一实例告诉我们,要有效地进行抽样,必须事先了解和掌握总体的结构及各方面的情况,并依据研究的目的明确地界定总体的范围。样本必须取自明确界定后的总体,样本中所得的结果,也只能推广到这种最初已作出明确界定的总体范围中。

2.制定抽样框

这一步骤的任务就是依据已经明确界定的总体范围,收集总体中全部抽样单位的名单,并通过对名单进行统一编号来建立起供抽样使用的抽样框。例如,如果我们要在某大学进行一项该校大学生职业观的抽样调查,那么,第一步是要先对总体进行界定。比如,本次调查的总体是该大学所有在读的全日制本科生和研究生。这样,该校那些专科生、夜大生以及其他一些不符合上述界定的学生就被排除在总体之外,而制定抽样框这一步的工作,就是要收集全校各系所有在读本科生及研究生的花名册,并按一定的顺序将全部花名册上的名单统一编号,形成一份完整的,既无重复又无遗漏的总体成员名单,即抽样框,从而为下一步抽取样本打下基础。

需要注意的是,当抽样是分几个阶段,在几个不同的抽样层次上进行时,则要分别建立起几个不同的抽样框。比如,为了解某市小学生的学习情况,需要从全市500所小学中抽取10所小学,再从每所抽中的小学中抽取3个班级,最后从每个抽中的班级中抽取10名小学生。那么,就要分别收集并排列全市500所小学的名单、每所抽中的小学里所有班级的名单,以及每个抽中的班级中所有学生的名单,形成三个不同层次的抽样框。

3.决定抽样方案

从前面有关抽样类型的介绍中,我们已经了解到具体的抽样方法有好几种。而从后面几节对这些方法的介绍中我们将会看到,各种不同的抽样方法都有自身的特点和适用范围。因此,对于具有不同研究目的、不同范围、不同对象和不同客观条件的社会研究来说,所适用的抽样方法也不一样。这就需要我们在具体实际抽样之前,依据研究目的的要求、依据各种抽样方法的特点,以及其他有关因素来决定具体采用哪种抽样方法。除了抽样方法的确定以外,还要根据要求确定样本的规模以及主要目标量的精确程度。

4.实际抽取样本

实际抽取样本的工作就是在上述几个步骤的基础上,严格按照所选定的抽样方法,从抽样框中抽取一个个的抽样单位,构成样本。依据抽样方法的不同,以及依据抽样框是否可以事先得到等因素,实际的抽样工作既可能在研究者到达实地之前就完成,也可能需要到达实地后才能完成。即既可能先抽好样本,再下去直接按预先抽好的对象进行调查或研究;也可能一边抽取样本,一边就开始调查或研究。

比如,若在一所大学中抽取200名学生进行调查,当这所学校的学生总数不是很大,且很容易弄到全校学生的花名册时,就可以事先从这份花名册中(即抽样框中)抽取出200名学生的名单;然后等其他准备工作均已做好,正式开始调查时,再按照事先已抽好的名单找到这200名学生进行调查。但当研究的总体规模较大,且抽样是采取多阶段方式进行时,就得边抽样边调查,比如,前述的某市小学生学习情况的课题项目。虽然500所小学中全体学生的名单并非完全不能弄到,但其数量实在太大,实际抽样也十分麻烦,这时往往采取多段抽样的方法;那么,从500所小学中随机抽取10所小学的工作可以事先完成,而从每所抽中的小学中抽取3个班级,以及从每个抽中的班级中抽取10名小学生的工作,则往往是到了实地(即具体小学)后再进行的。

到实地进行抽样时,往往是直接由调查员按预先制定好的操作方式或具体方法执行。比如,要抽取居民家庭时,往往是先抽好居委会,然后制定出具体操作方式:“楼房按单元抽,一个单元抽一户;平房按排抽,一排抽一户;两种抽样都采取简单随机抽样的方法,每个调查员随身带20张写好号码的小纸片装在口袋中,摸到什么号码就抽取其对应的家庭。”这样,调查员就可以一边抽样,一边调查了。

5.评估样本质量

一般情况下,样本的抽出并不是抽样过程的结束。完整的抽样过程还应包括样本抽出后对样本进行的评估工作。所谓样本评估,就是对样本的质量、代表性、偏差等进行初步的检验和衡量,其目的是防止由于样本的偏差过大而导致的失误。评估样本的基本方法是:将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比;若两者之间的差别很小,则可认为样本的质量较高,代表性较大;反之,若两者之间的差别十分明显,那么样本的质量和代表性就一定不会很高。举例来说,如果我们从一所有4000名学生的大学中抽取200名学生作为样本,同时,我们从学校有关部门那里得到下列统计资料:全校男生占学生总数785,女生占22%;本省学生占64%,外省学生占36%;那么,我们可以对抽出的200名学生进行这两方面情况的统计。假定样本得到的结果为:男生占76%,女生占24%;本省学生占67%,外省学生占33%。两相对比,不难发现两者之间的差距很小,它在一定程度上说明,样本的质量和代表性较高。从这样的样本中得到的结果就能较好地反映和体现总体的情况。当然,用来进行对比的指标越多越好,各种指标对比的结果越接近越好。

四、抽样设计的原则

在进行抽样设计时,应遵循一定的原则。英国著名的抽样专家科什(Kish)教授在其名著《调查抽样》中提出了一个优秀的抽样设计所应该满足的四条标准,这四条标准也可以说是进行抽样设计时所应遵循的四条原则。它们是:(1)目的性原则。(2)可测性原则。(3)可行性原则。(4)经济性原则。[4]

(1)目的性原则是指在进行抽样方案设计时,要以课题研究的总体方案和研究的目标为依据;以研究的问题为出发点,从最有利于研究资料的获取,以及最符合研究的目的等因素来考虑抽样方案和抽样方法的设计。

(2)可测性原则指的是抽样设计能够从样本自身计算出有效的估计值或者抽样变动的近似值;在研究中通常用标准误来表示,这是统计推断必需的基础,是样本结果与未知的总体值之间客观、科学的桥梁。通常,只有概率样本在客观上才是可测的,即概率样本可以计算出有效的估计值或抽样变动的近似值。但是,概率抽样也并不自动保证可测性;比如,从一个具有周期性变化的总体中选出一个系统样本,就不能保证这种可测性。

(3)可行性原则是指研究者所设计的抽样方案必须在实践上切实可行。它意味着研究者所设计的方案能够预料实际抽样过程中所可能出现的各种问题,并设计了处理这些问题的方法。由于在理论上设计抽样方案和在实际中执行这一方案是两码事,因而可行性是抽样设计的一条重要标准。

(4)经济性原则主要指的是抽样方案的设计要与研究的可得资源相适应,这种资源主要包括研究的时间、经费和人力,等等。

由于这四条标准相互之间存在着一定的制约关系,甚至会相互冲突,因而在实际设计中,常常存在这样的情况,即研究者很难设计出一个在上述四个原则上同时达到最大值的抽样方案。在更多的情况下,实际的抽样设计就成为研究者在这四条标准中进行取舍和保持平衡的过程。比如,如果要加强抽样方案的可测性,研究者就应该尽可能加大样本的容量;然而在这样做的时候,却同时又意味着增加抽样所需的资源。这就使得抽样设计的经济性原则进一步减弱。相对而言,这四条标准中,目标定向原则和可行性原则是首要的。抽样设计要服务于研究的目标,这是设计的出发点和基本目的。而可行性原则是设计方案得以实现的前提和保证。研究者应该在优先考虑这两条标准的基础上,进一步增加方案的可测性同时减少方案所需的资源。

五、概率抽样的方法

概率抽样是按照概率原理进行的,它要求样本的抽取具有随机性。前面已经提到,概率抽样有若干种不同的形式,每一种具体的形式有着各自不同的特点。而在研究中对不同抽样方式的选择将涉及研究问题的性质、完善的抽样框的获得、研究经费的多少、样本精确性的要求,以及资料的收集方法等因素。下面我们就结合这些因素对常用的几种概率抽样方法逐一进行介绍。

1.简单随机抽样(simple random sampling)

简单随机抽样又称纯随机抽样,是概率抽样的最基本形式。它是按等概率原则直接从含有N个元素的总体中随机抽取n个元素组成样本(N>n)。常用的办法类似于抽签,即把总体的每一个单位都编号,将这些号码写在一张张小纸条上,然后放入一容器如纸盒、口袋中,搅拌均匀后,从中任意抽取,直到抽够预定的样本数目。这样,由抽中的号码所代表的元素组成的就是一个简单随机样本。

比如,某系共有学生300人,系学生会打算采用简单随机抽样的办法,从中抽取60人进行调查,为了保证抽样的科学性,他们先从系办公室得到一份全系学生的名单。然后给名单中的每个学生都编上一个号(001~300)。抽样框编好后,他们又用300张小纸条分别写上001,002,…,300的号码。他们把这300张写好不同号码的小纸条放在一个盒子里搅乱,随便摸出60张小纸条。然后,他们按这60张小纸条上的号码找到总体名单上所对应的60位同学。这60位同学就构成了他们本次的样本。这种方法简便易学。但当总体元素很多时,写号码的工作量就很大,搅拌均匀也不容易,因而此法往往在总体元素较少时使用。

对于总体元素很多的情形,我们则采用随机数表来抽样。本书的附录一中就附有一张随机数表,表中的数码和排列都是随机形成的,没有任何一点规律性(故也称乱数表)。利用随机数表进行抽样的具体步骤是:

①先取得一份总体所有元素的名单(抽样框);

②将总体中所有元素一一按顺序编号;

③根据总体规模是几位数来确定从随机数码表中选几位数码;

④以总体的规模为标准,对随机数表中的数码逐一进行衡量并决定取舍;

⑤根据样本规模的要求选择出足够的数码个数;

⑥依据从随机数码表中选出的数码,到抽样框中去找出它所对应的元素。

按上述步骤选择出来的元素的集合,就是所需要的样本。举例来说,某总体共3000人(四位数),需要从中抽取100人作为样本进行调查。我们首先要得到一份总体成员的名单;然后对总体中的每一个人按1~3000进行编号;再根据总体的规模,确定从随机数表中,选择四位数。具体的选法是从随机数表的任意一行和任意一列的某一个四位数开始,按照从左到右的顺序,或者从下到上的顺序,以3000为标准,对随机数表中依次出现的每个四位数进行取舍:凡小于或等于3000的数码就选出来,凡大于3000的数码以及已经选出的数码则不要。一直到选够100个数码为止;最后按照所抽取的数码,从总体名单中找到它们所对应的100个成员。这100个成员就构成一个随机样本。表5-3就是在对3000人的总体进行抽样时,我们采用随机数表对四位数码进行取舍的例子(采用后四位数,并按从上往下的顺序)。

表5-3 随机数表抽样举例

img39

如果采用前四位数字,仍按从上往下的顺序,那么从表5-3中我们又可以抽取1053、0139、1359、2725这四个号码。如果取中间的四位数字,所得到的则是2990、1404、1912和0582这四个号码了。

2.系统抽样(systematic sampling)

系统抽样又称等距抽样或机械抽样,它是把总体中的单位进行编号排序后,再计算出某种间隔,然后按这一固定的间隔抽取个体的号码来组成样本的方法。它和简单抽样一样,需要有完整的抽样框,样本的抽取也是直接从总体中抽取个体,而无其他中间环节。

系统抽样具体步骤:

①将总体的所有个体按顺序编号,即制定出抽样框;

②计算抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为n,那么抽样间距k就由下列公式求得:k(抽样间距)=img40

③在最前面的k个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号(假设所抽取的这个个体的编号为A),它称作随机的起点;

④在抽样框中,自A开始,每隔k个个体抽取一个个体,即所抽取个体的编号分别为A,A+k,A+2k,…,A+(n-1)k;

⑤将这n个个体合起来,就构成了该总体的一个样本。

例如,要在某大学总共3000名学生中,抽取一个容量为100的大学生样本。我们先将3000名学生的名单依次编上号码,然后按上述公式求得抽样间距为:img41。即每隔30个人抽一名。为此,我们先在1~30的号码中,采用简单随机抽样的方法抽取一个数字。假如抽到的是12,那么就以12为第一个号码,每隔30名再抽一个。这样,我们便得到12,42,72,…,2972总共100个号码。我们再根据这100个号码,从总体名单中一一对应地找出100名学生,这100名学生就构成了本次的一个样本。

从上述的过程中我们不难看出,系统抽样较之于简单随机抽样来说,显然简便易行多了,尤其是当总体及样本的规模都较大时更是如此。这也正是社会研究较少采用简单随机抽样而较多采用系统抽样的原因。

值得注意的是,系统抽样的一个十分重要的前提条件,是总体中个体的排列,相对于研究的变量来说,应是随机的,即不存在某种与研究变量相关的规则分布。否则,系统抽样的结果将会产生极大的偏差。因此,我们在使用系统抽样方法时,一定要注意抽样框的编织方法。特别注意以下两种情况:

一是总体名单中,个体的排列有某种次序上的先后、等级上的高低的情况。比如,我们要抽取若干家庭的样本进行消费状况调查,而家庭户的名单是按每个家庭总收入的多少由高到低顺序排列的。这样,如果有两个研究者都采用系统抽样的方法从这个总体中进行抽样,一个抽到抽样间距中靠前的号码,比如3,而另一个抽到的是抽样间距中靠后的号码,比如间距为40时抽到38。那么,从前一个研究者所抽样本中算出的家庭平均收入,一定大大高于后者所抽样本中算出的家庭平均收入。因为第一个样本中的每一个家庭都要比第二个样本中的每一个家庭在收入等级中靠前35个位置,即前者中的每一个家庭都比后者中的每一个家庭在总收入上高出35户家庭。如果我们事先注意到这种情况,就可以采取措施,打乱其原来的顺序,重新编制总体名单,或者改用其他的抽样方法。

二是总体名单中,个体的排列上有与抽样间隔相对应的周期性分布的情况。比如,前面关于大学生一例中,我们计算出间距为30。如果此时总体名单是按教学班排列,每班正好也是30个左右的学生,并且每班的名单都是按学生学习成绩高低排列,或是按班干部、一般学生、较差学生的顺序排列的。那么,当所抽的初始号靠前时,样本就由各班上成绩优秀的学生组成,或是全由各班的班干部组成;而当所抽的初始号靠得较后时,样本就会由各班中成绩较差的学生,或是各方面表现较差的学生组成。显然,无论是哪种情况,都不符合总体的全面情况,都是个体有着严重偏差的样本。

3.分层抽样(stratified sampling)

(1)分层抽样的含义。

分层抽样又称类型抽样,它是先将总体中的所有单位按某种特征或标志,如性别、年龄、职业或地域等,划分成苦干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的办法抽取一个子样本,最后,将这些子样本合起来构成总体的样本。例如,在一个企业抽取职工样本时,首先,我们可以把职工总体分为工人、干部和技术人员三大类。然后,采用简单随机抽样或系统抽样的方法,分别从这三类职工中抽取三个子样本。最后,将这三个子样本合起来构成全体职工的样本。

(2)分层抽样的优点。

分层抽样方法的一个优点,就是在不增加样本规模的前提下降低抽样误差,提高抽样的精度。前面我们曾经指出,总体的同质性程度越高,样本就越容易反映和代表总体的特征和面貌;而总体的异质性程度越高,样本对总体的反映和代表就越困难,对抽样的要求就越高。采用分层抽样的最基本目的,正是在于把异质性较强的总体分成一个个同质性较强的子总体,以便提高抽样的效率,达到更好的抽样效果。用统计的语言来说,通过分层,使得各层内元素之间的变异程度变小,各个层内的方差变小(比总体的方差要小),因而在样本规模相同时,分层抽样的抽样误差往往比简单随机抽样的抽样误差要小。

分层抽样方法的另一个优点,就是非常便于了解总体内不同层次的情况,以及对总体中不同的层次进行单独研究,或者进行比较。比如,在《中国妇女社会地位调查》中,研究者为了能分析比较城乡差别,提高抽样精度,并能保证城市分析具有足够的样本容量。他们采取了各个省在省内进一步按城乡分域(实际上是作为研究域的分层),分别进行抽样的做法,并使城乡两域的样本规模相等。这表明,该调查采用的是不按比例的分层抽样方式。

(3)分层抽样的运用。

在实际运用分层抽样的方法时,研究者需要考虑下列两方面的问题:①分层的标准问题。同一个总体可以按照不同的标准进行分层,或者说,根据不同的标准可以将一个总体分成不同的类别或层次。那么,在实际抽样中究竟应该按什么标准来分层呢?通常采用的原则有:第一,以所要分析和研究的主要变量或相关的变量作为分层的标准。比如,若要研究居民的消费状况和消费趋向,可以以居民家庭人均收入作为分层标准;又如,要了解社会研究中不同职业的人员对社会经济改革的看法,就可以以人们的职业作为分层的标准。第二,以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作为分层变量。比如,在工厂进行,可以以工作性质作为分层标准,将全厂职分为干部、工人、技术人员、勤杂人员等几类来进行抽样。第三,以那些已有明显层次区分的变量作为分层变量。比如,在社会研究中,性别、年龄(当然是分段以后,如老、中、青)、文化程度、职业,等等,就经常被用做分层的标准;其他如学生按年级、专业、学校类型分层,城市按人口规模分层,等等。②分层的比例问题。分层抽样中有按比例和不按比例分层两种方法。按比例分层抽样是指按各种类型或层次中的单位数目同总体单位数目间的比例来抽取子样本的方法。即在单位多的类型或层次中所抽的子样本就大一些,在单位少的类型或层次中所抽的子样本就小一些。比如,某厂有工人600人,按性别分层则有男工500人,女工100人。两类工人人数与总体人数的比例分别为5∶6与1∶6。因此,若要抽60人作样本。那么,按比例的抽法就是根据上述比例,分别从500名男工中随机抽取50人,而从100名女工中随机抽取10人。这样,样本中男女工人之比与总体中男女工人之比完全相同,均为5∶1。可以说,样本的性别结构是总体中性别结构的一种缩影。

采取按比例分层抽样的方法,可以确保得到一个与总体结构完全一样的样本。但是,在有些情况下,又不宜采用这种方法。例如,有时总体中有的类型或层次的单位数目太少,若以按比例分层的方法抽样,则有的层次在样本中个案太少,不便于了解各个层次的情况。这时往往要采取不按比例抽样的方法。如上例中,我们可以在500名男工中抽30人,在100名女工中也抽30人。这样,样本就能很好地反映出男女两类工人的一般状况,我们也能很好地对男女两类工人的情况进行比较和分析。

但需要注意的是,我们采用不按比例分层抽样的方法,主要是便于对不同层次的子总体进行专门研究或进行相互比较。但若要用样本资料推断总体时,则需先对各层的数据资料加以处理,即通过调整样本中各层的比例,使数据资料恢复到总体中各层实际的比例结构。如上例中,若要用30个男工,10个女工的收入资料去推断全厂工人的平均收入时,就需要在男工的收入后乘以5/3,而在女工的收入后乘以1/3,再加总平均,否则就会导致推断的偏误。

分层抽样与定额抽样的不同之处:第一,目的不同:定额抽样要保证样本与总体在结构比例表面上一致;分层抽样则包括比例分层和非比例分层;第二,方法不同:定额抽样中各层样本是非随机抽取的;而分层抽样中各层样本是随机抽取的。

4.整群抽样(cluster sampling)

整群抽样与前几种抽样的最大差别在于,它的抽样单位不是单个的个体,而是成群的个体。它是从总体中随机抽取一些小的群体,然后由所抽取的若干个小群体内的所有元素构成的样本;这种小的群体可以是居民家庭,可以是学校中的班级,也可以是工厂中的车间,还可以是城市中的居委会,等等。整群抽样中对小群体的抽取可采用简单随机抽样、系统抽样或分层抽样的方法。

举例来说,假设某大学共有100个班级,每班都是30名学生,总共有3000名学生。现要抽300名学生作为样本。如果我们采用整群抽样的方法,就不是直接去抽一个个的学生,而是从全校100个班级中,采取简单随机抽样的方法(或是系统抽样、分层抽样的方法)抽取10个班级,然后由这10个班级的全部学生(300名)构成样本。

采取整群抽样的方法,不仅可以简化抽样的过程,更重要的是它可以降低收集资料的费用,同时还能相对地扩大抽样的应用范围。在简单随机抽样和系统抽样中,都要求有一份总体所有成员的名单,即抽样框。但在实际过程中,这样的名单往往难以获得;有时即使可以获得,真正运用起来也十分麻烦,因此,上述两种抽样方法的应用范围受到一定限制。例如,要在一个有10万户家庭的城市中抽取1000户家庭进行调查,若按上述两种方法,就必须首先弄到一份这10万户家庭的排列名单。而在实际中,这样的名单往往是很难弄到的。这时,如果采用整群抽样的方法,就可以省去这种麻烦,使抽样变得简单易行。比如,我们可以按居民委员会来编制抽样框。假设全市共有200个居委会,每个居委会有500户左右的家庭。那么我们只需弄到一份200个居委会的名单,并按上述两种方法之一,从中抽取两个居委会,然后将这两个被抽中的居委会中的所有家庭户作为我们的样本就行了。从这一事例中我们不难看出整群抽样所具有的优点。许多较大规模的社会研究往往从节省经费、人力以及从研究的可行性等方面考虑,而采用整群抽样的方法。例如,20世纪80年代中期由中国社会科学院社会学所等单位组织进行的《五城市婚姻家庭调查》,就是采用这种整群抽样的方法,从五个城市中抽取了八个居民点,以这八个居民点所包括的总共4385户家庭作为样本进行的。

但是,应该看到,整群抽样所具有的简便易行、节省费用的优点,是以其样本的分布不广、样本对总体的代表性相对较差等缺点为代价的。由于整群抽样所得样本中的个体相对集中,而涉及的面相对缩小,故在许多情况下会导致样本的代表性不足,使得结果的偏差较大。拿上面的例子来看,由200个居委会中任何两个居委会所包含的1000户家庭,显然受到具体的地理、职业等社区条件和环境的限制,往往难以体现出整个城市的不同地段、不同职业、不同生活区居民家庭的特点。这1000户家庭对全市家庭的代表性,比起用简单随机抽样,或者系统抽样和分层抽样的方法抽取的1000户家庭来说,显然要差一些。

为了更好地理解整群抽样的特点。我们可以将整群抽样与前述几种抽样方法,特别是分层抽样方法做些比较。假设我们的总体是全国所有城市的集合,我们要抽取一个规模为40个城市的样本,若按简单随机抽样或系统抽样的方法,则首先需要弄到一份全国城市的名单,然后根据随机数表或通过计算抽样间距直接从抽样框中抽取城市;若按分层抽样的方法,则首先可以按城市规模将总体分为特大城市、大城市、中等城市和小城市四类,然后分别从每一类中抽取若干城市,并将这些城市合起来构成样本;而如果采用整群抽样的方法,则可以以省(自治区,直辖市)为抽样单位,从全国31个省(自治区、直辖市)中随机抽取三至五个省(自治区、直辖市),再以所抽中的这些省(自治区、直辖市)中所包含的全部城市的集合作为样本。

整群抽样方法的运用,尤其要与分层抽样的方法相区别。当某个总体是由若干个有着自然界限和区分的子群(或类别、层次)组成。同时,不同子群相互之间差别很大,而每个子群内部的差异不大时,则适合于分层抽样的方法;反之,当不同子群相互之间差别不大,而每个子群内部的异质性程度比较大时,则特别适合采用整群抽样的方法。

5.多段抽样(multistage sampling)

多段抽样又称多级抽样或分段抽样。它是按抽样元素的隶属关系或层次关系,把抽样过程分为几个阶段进行。在社会研究中,当总体的规模特别大,或者总体分布的范围特别广时,研究者一般采取多段抽样的方法来抽取样本。多段抽样的具体做法是:先从总体中随机抽取若干大群(组),然后再从这几个大群(组)内抽取几个小群(组),这样一层层抽下去,直至抽到最基本的抽样元素为止。

比如,为了调查某市青年工人的状况,需要从全市青年工人这一总体中抽取样本。我们可以把抽样过程分为以下几个阶段进行。首先,以企业为单位抽样,即以全市的所有企业为抽样框,从中随机抽取一部分企业;然后在抽中的企业里,以车间为抽样单位抽样,即从全部车间中抽出若干个车间;最后,再在抽中的车间内抽出青年工人。需要说明的是,在上述每个阶段的抽样中,都要采用简单随机抽样或分层抽样的方法进行。

在运用多段抽样方法时,有一点需要注意,就是要在类别和个体之间保持平衡。或者说,保持合适的比例。举例来说,假设某市共有2.4万名教师,他们分布在全市10个区的200所学校中。现在要抽取一个由1200名教师组成的样本。如果按照三阶段抽样的方法,我们就可以有下列各种不同的抽样选择(见表5-4)。

表5-4 多段抽样举例

img42

注:每个元素被抽中的概率=所抽取的群数×(群的规模/总体的规模)×(平均每个群中所要抽取的元素/群的规模)

究竟该选择哪一种抽样方案呢?或者说,如何确定每一阶段抽样的单位数目呢?主要考虑的因素有两个方面:(1)各个抽样阶段中的子总体同质性程度。同质性程度越高的子总体,所抽的规模就应相对小一点;反之,则应大一点。比如,如果该市的10个区中,属于不同的区的学校相互之间差别很大,那么就应该加大第一阶段的抽样规模(即应采取方案1)。如果区与区之间的学校在总体上差别不大,而每一个区中,不同的学校相互之间却差别很大。那么就应该减小第一阶段的抽样规模,加大第二阶段的抽样规模(即应采取方案2)。如果区与区之间、学校与学校之间的差别都不大,倒是每所学校中教师与教师之间的差别很大,那么我们就应该尽量加大第三阶段的抽样规模,而相应地减小第一和第二阶段的抽样规模(如采取方案8或方案9)。(2)要考虑研究者所拥有的经费和人力。从方案3至方案9,我们来看一下。样本所覆盖的区和学校面:所覆盖的区是方案3最大(所有的区),依次减小,方案9最小(仅一个区);所覆盖的学校数目也是从方案3至方案9依次减小(分别为200、120、60、40、30、20、12)。一般来说,在其他条件不变的情况下,样本所覆盖的面越大,样本的代表性也越大。因此,如果仅从这方面考虑,则“大的类别中抽取单元相对较多,而每一单元中抽取个体相对较少”的做法效果较好(即方案3最好,依次递减,方案9最差)。但是,抽样时我们还应从实践的角度来进行衡量。抽的区越多、抽的学校越多,同时也意味着在收集资料时,调查员要奔波的范围越广,所需要的时间、经费越多。而这则是研究者往往最不愿意看到的。所以,如果从这方面来考虑,则“大的类别中相对较少,而每一类中抽取的个体相对较多”的做法效果较好(即方案9最好,依次递减,方案3最差)。

多段抽样的方法适用于总体范围特别大、对象的层次特别多的社会研究。由于它不需要总体的全部名单,各阶段的抽样单位数一般较少,因而抽样比较容易进行。但由于每级抽样时都会产生误差,故这种抽样方法的误差较大,这是它的主要不足。在同等条件下减少多段抽样误差的方法是:相对增加开头阶段的样本数而适当减少最后阶段的样本数。所以,当研究者的经费和人力允许时,应尽量扩大开头阶段的抽样规模。对于上例来说,就是要尽可能像方案3、方案4、方案5那样去设计。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈