首页 理论教育 随机抽样每个样本被抽中的概率

随机抽样每个样本被抽中的概率

时间:2022-03-11 理论教育 版权反馈
【摘要】:非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其他条件来抽取样本。所以,在大规模的正式研究中,一般很少用非概率抽样,常常只是在探索性研究中采用。常用的非概率抽样有以下几种:偶遇抽样、判断抽样、配额抽样和雪球抽样。但是由于它仍然属于一种非概率抽样,所以,其所得样本的代表性往往难以判断。
非概率抽样_社会调查与统计

第二节 非概率抽样

在社会研究中,人们有时采用非概率抽样的办法来选取样本。非概率抽样不是按照概率均等的原则,而是根据人们的主观经验或其他条件来抽取样本。因而,其样本的代表性往往较小,误差有时相当大,而且这种误差又无法估计。所以,在大规模的正式研究中,一般很少用非概率抽样,常常只是在探索性研究中采用。非概率抽样是指依据研究者的主观意愿、判断或是否方便等因素来抽取对象的方法。常用的非概率抽样有以下几种:偶遇抽样、判断抽样、配额抽样和雪球抽样。

一、偶遇抽样(accidental sampling)

偶遇抽样又称作方便抽样或自然抽样,是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为对象,或者仅仅选择那些离得最近、最容易找到的人作为对象。如为了调查某市的交通情况,研究者到离他们最近的公共汽车站,把当时正在那里等车的人选做调查对象;其他类似的偶遇抽样还有:在街头路口拦住过往行人进行调查;在图书馆阅览室对正在阅览的读者进行调查;在商店门、展览大厅、电影院等公共场所对进出往来的顾客、观众进行的调查;利用报纸杂志向读者进行的调查;老师以他所教的班级的学生作为样本所进行的调查,等等。

这种碰到谁就选谁的抽样方法往往被有些人误认为就是随机抽样。仅从表面上看,两者的确有些相似,都排除了主观因素的影响,纯粹依靠客观机遇来抽取对象。但两者有一个根本的差别,这就是偶遇抽样没有保证总体中的每一个成员都具有同等的被抽中的概率。那些最先被碰到的、最容易被见到的、最方便被找到的对象具有比其他对象大得多的机会被抽中。正是这一点使我们不能依赖偶遇抽样得到的样本来推论总体。

二、判断抽样(judgmental sampling)

判断抽样又称作立意抽样(purposive sampling),它是研究者根据研究的目标和自己主观的分析来选择和确定研究对象的方法。这种抽样首先要确定抽样标准。由于标准的确定带有较大的主观性,所以,此法的运用结果如何往往与研究者的理论修养、实际经验及对对象的熟悉程度有很大关系。

判断抽样的主要优点在于可以充分发挥研究人员的主观能动性。特别是当研究者对研究总体的情况比较熟悉、研究者的分析判断能力较强、研究方法与技术十分熟练、研究的经验比较丰富时,采用这种方法往往十分方便。但是由于它仍然属于一种非概率抽样,所以,其所得样本的代表性往往难以判断。在实际中,这种抽样多用于总体规模小、所涉及的范围较窄或时间、人力等条件有限而难以进行大规模抽样的情况。

三、配额抽样(quota sampling)

配额抽样又称作定额抽样。研究者先要尽可能地依据那些有可能影响研究变量的因素来对总体分层,并找出具有各种不同特征的成员在总体中所占的比例;然后依据这种划分以及各类成员的比例去选择对象,使样本中的成员在上述各种因素、各种特征方面的构成及其在样本中的比例尽可能接近总体。如果把各种因素或各种特征看做不同的变数的话,那么,定额抽样实际上就是依据这些变数的组合。

我们以性别、年级和专业三个因素来解释这种变数的组合及其定额抽样的实施办法。假设某高校有4000名学生,其中男生占60%,女生占40%;文科学生和理科学生各占50%;一年级学生占40%、二年级、三年级、四年级学生分别占30%、20%和10%。现在要用定额抽样方法依上述三个变数抽取一个规模为100人的样本。依据总体的构成和样本规模,我们可得到下列定额表(见表5-2)。

表5-2 100个人的定额样本分布表

img22

表5-2的最下面一行就是样本中具有各种特征的学生数目。这一数目是依据总体中的结构分配的,它使得样本在这几个方面与总体保持了一致。可以想象,如果所依据的类似特征(即变量)越多,样本中成员的分类将越细,与总体的结构也将越接近。同时我们也可以看出,每增加一个分类特征,这种分布就会复杂一层,抽样就会困难一步。因此,研究者应根据研究的主要目标来进行配额抽样。

当研究的主要目标不是去推断总体状况,而主要是为了检验理论、解释关系或比较不同性质的群体时,通常不需要进行严格的随机抽样,不需要得到对总体有代表性、有概括性的样本。此时的抽样标准不是代表性,而是合适性——抽样适合研究的目标,适合检验理论和假设的需要,适合比较的需要。英克尔斯在研究人的现代性时,就是根据合适性的原则,采用配额抽样,而没有采用随机抽样。他写道:“我们没有寻找代表性的样本,而是寻找非常适合于目标的配额样本,个人与群体之所以被选入样本,是因为它们同我们要检验的理论有关……”[2]他的抽样设计见图5-2。就是他们对作为调查点的六个国家的选样,也是基于类似的考虑。“这些国家之所以使我们感兴趣,不是因为它们代表所有其他的国家,而是因为它们的人民符合我们的实验设计中的那些条件。”[3]

许多书中都谈到定额抽样与后面将介绍的分层抽样十分相似,或把定额抽样称为分层抽样在非概率抽样中的对应词。实际上,两者同样具有本质上的差别。两者虽然都依据某些特征对总体进行分层,但两者的目的不同,抽样方法也不同。定额抽样之所以分层分类,其目的在于要抽取一个总体的“模拟物”,其方法则是通过主观的分析来确定和选择组成这种模拟物的成员。也就是说,定额抽样注重的是样本与总体在结构比例上的表面一致性。而分层抽样进行分层,一方面是要提高各层间的异质性与同层中的同质性;另一方面也是为了照顾到某些比例小的层次,使得所抽样本的代表性进一步提高,误差进一步减小,而其抽样的方法则是完全依据概率原则,排除主观因素,客观地、等概率地到各层中进行抽样,这与定额抽样中那种“按照先规定的条件,有目的地寻找”的做法是完全不同的。

img23

图5-2 现代人研究抽样示意图

四、雪球抽样(snowball sampling)

当我们无法了解总体情况时,可以从总体中少数成员入手,对他们进行调查,向他们询问还知道哪些符合条件的人;再去找那些人并询问他们知道的情况。如同滚雪球一样,我们可以得到越来越多具有相同性质的群体成员。如果总体不大,有时用不了几次就会接近饱和状况,即后访问的人再介绍的都是已经访问过的人。例如,要研究退休老人的生活,可以清晨到公园去结识几位散步老人,再通过他们结识其朋友。不用很久,你就可以结交上一大批老年朋友。但是这种方法的偏误也很大,那些不喜欢活动,不爱去公园、不爱和别人交往,而喜欢一个人在家里活动的老人,你就很难把雪球滚到他们那里去,而他们却代表着另外一种退休后的生活方式。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈