首页 百科知识 抽样调查的基本方法

抽样调查的基本方法

时间:2022-10-21 百科知识 版权反馈
【摘要】:依照抽样调查的理论依据和特点,可将抽样调查的基本方法分为两大类:随机抽样和非随机抽样。随机抽样的方式主要有简单随机抽样、类型抽样、等距抽样和多段抽样。非随机抽样又叫非概率抽样,它是根据研究者个人的方便,以人的主观经验、设想来有选择地抽取样本并进行调查的。即抽样时不需对调查总体进行任何分组或排列,任其自然,或者拌和均匀,从中任意抽取预定的单位个数作为样本。否则,所抽样本可能缺乏代表性,抽样误差较大。
抽样调查的基本方法_现代社会调查方法

四、抽样调查的基本方法

依照抽样调查的理论依据和特点,可将抽样调查的基本方法分为两大类:随机抽样和非随机抽样。随机抽样又叫概率抽样,它是一种按照概率原理来抽取样本、总体中的每一个单位都具有同等被抽中的可能性的抽样方法。随机抽样的方式主要有简单随机抽样、类型抽样、等距抽样和多段抽样。非随机抽样又叫非概率抽样,它是根据研究者个人的方便,以人的主观经验、设想来有选择地抽取样本并进行调查的。非随机抽样的方式主要有判断抽样、偶遇抽样和定额抽样。

1.随机抽样

(1)简单随机抽样,又称纯随机抽样,是随机抽样的最基本也是最常见的类型。它是按随机的原则,直接从含有N个单位的总体中,抽出n个单位作为样本的一种抽样方法。即抽样时不需对调查总体进行任何分组或排列,任其自然,或者拌和均匀,从中任意抽取预定的单位个数作为样本。这种抽样方法最严格地遵从了使每个单位有同等被抽中机会的随机原则。通常所见的抽签、摇奖等等形式,都属于这种抽样法。

简单随机抽样的具体做法可以分为抽签法和随机号码法两种。

抽签法是将总体中每个单位的名称或号码,逐个填写在卡片或签条上,将卡片或签条放在一容器中,打乱次序,进行搅拌,然后从中任意抽出所需数目的调查单位。抽签法又可以分为有回置抽签和非回置抽签两类。为保证总体单位数的同一和样本抽中的同等可能性,一般使用有回置的抽样方法(也称重复抽样)。对于重复抽取的样本则可舍去。

随机号码法是将总体所有单位进行编码,一个单位一个号码,然后利用随机数字表,挑出所需的调查单位。

使用随机数字表时,可以根据总体单位的数目来确定使用几位随机号码,从表中任何一栏的任何一行开始,向任何一个方向摘取数字,凡符合总体单位编号的,即为抽中的单位,直到抽满所需样本数为止。例如,从某省500个村子中,随机抽20个村进行调查,村子的编号是1—500。这样,可以确定使用三位数。假定从第2栏第7行开始(见本书附录Ⅱ),自上而下摘取号码,所得三位数依次是421,016,211,608,180,623……凡数字小于500的,符合要求,即为抽中的单位。凡数字大于500的,不符合要求,不要。此外,重复的数字也应舍去。这样抽取的号码即为421、016、211、180、424、362……269。

简单随机抽样法最符合抽样的随机原则,且简便易行。但这种方法要求在总体单位数目不大、总体单位之间差异程度较小的情况下才能使用。否则,所抽样本可能缺乏代表性,抽样误差较大。另外,如果在大范围内使用这种方法抽取样本,样本分布有可能很分散,这就会给实际的调查工作带来困难。例如,从全国家庭中以单纯随机法抽出来的样本家庭,地址非常分散,有时一个调查员只能调查一个家庭,调查费用很大,调查人员的挑选、训练等也有种种不便。由于存在上述局限性,简单随机抽样法一般不单独使用。

(2)类型抽样,又称分层抽样或分类抽样。它是把调查总体按一定的标准分为若干类型,然后从每一类中按照相同或不同的比例随机抽取样本的一种抽样方法。例如,对企业进行调查时,将企业划分为煤炭、石油、电力冶金、化工、机械等部门;农产量调查,按地形条件不同,将调查单位分为平原、丘陵、山区几种类型。然后,在每一个部门、每一种类型中随机抽取若干企业、若干地块进行调查。分类的基本原则,一是要使每一类型内部的差异尽量缩小,而各类型之间的差异尽量增大。二是要有清楚的界限,在划分时不致发生混淆或遗漏。

分类的具体做法又可以分为分类定比抽样和分类异比抽样两类。

a.分类定比抽样,是指按各类型在总体中所占的比例而在各类型内随机抽取样本。例如,某市老年人、中年人和青年人共计19 200人,其中老年人占10%,中年人占40%,青年人占50%。要了解三个不同年龄层次的人对改革的看法,分层抽样所用的样本比例应与上述比例相符,由此推论总体的特征才有意义。根据各类型的抽样比例,即可求得需要抽取的各类型的样本单位数:如要抽取500人进行调查,老年人的样本数目应为500×10%=50,中年人的样本数为500×40%=200,青年人的样本数为500×50%=250,即在全市要抽的500个人中,老年人应抽50人,中年人应抽200人,青年人应抽250人。

b.分类异比抽样,是指当某个类型所包含的个案数在总体中所占比例太小,为了使该类型的特征能在样本中得到足够的反映,需要适当加大该类型在样本中所占的比例。例如,上例中若需充分了解老年人的态度,就可放宽抽样比例至20%。

类型抽样通过划分类型把总体中标志值比较接近的单位归为一种类型,一方面,它使各类型中的单位之间共同性增大,差异程度缩小;另一方面,它使样本在各类型内的分布比较均匀,而且保证各组都有中选的机会。在此基础上进行随机抽样,就可提高样本的代表性,具有较好的抽样效果。因此,在总体构成复杂、内部各单位差异较大、单位数目较多的情况下,最适宜采用类型抽样法。另外,类型抽样的分类往往按行政区划成一定的组织形式进行。例如,农业产量抽样按地区分类,产值调查按国民经济部门分类,产品质量抽样按各类型号分类,这就给抽样组织的工作带来许多便利。所以类型抽样在实际工作中得到了广泛的应用。

(3)等距抽样,又称机械抽样或系统抽样。它是把总体中的全部调查单位按某一标志排列起来,按固定顺序和间隔抽取样本。例如,要在2 000名大学生中抽100名大学生进行学习方法的调查,可将这些学生依次编码,用全部学生人数除以调查的学生人数,计算出抽样间距为20。抽样的起点可从第一组20个人中用简单随机抽样法确定。然后每隔20个人抽一个人。如第一组中抽中的编码是4,则要抽的100个人的编号依次是第24、44、64……,直到抽满100个人为止。

用作总体各单位顺序排列的标志,可以是无关标志也可以是有关标志。所谓无关标志,是指排列的标志与单位变量数值的大小无关、性质不同。如调查城市居民户的收入或消费情况,可沿着街道门牌号码等距抽取居民户;进行工业产品质量检查,可每间隔一定生产时间抽取少量产品进行质量检查;人口普查中的抽样检查,包括生育率、性别比例的抽样调查等,均可按登记册上的习惯次序编号排队进行等距抽样。在按无关标志排队的条件下,各调查单位的位次排定,并不等于各单位的调查标志值也按同一次序排定。所以,这种等距抽样实质上相同于简单随机抽样,只是抽样形式不同而已,完全符合随机原则。所谓有关标志是指排列的标志与单位变量数值的大小有密切关系或共同性质。如,职工或农民收入调查,以本年人均收入为调查变量,就以往年人均收入作为排队的标志,抽取调查户。农产量调查,以本年平均亩产为调查变量,就以往年已知平均亩产作为排队的标志抽样调查。由此可见,按有关标志排队实质上是运用类型抽样的一些特点,有利于提高样本的代表性。如果在调查前取得与调查项目有关标志的全面资料,用以作为排队抽样的依据,可以提高样本单位的代表性。在我国国民经济各部门,都建立了全面统计制度,为抽样调查的分类、排队提供了有利条件。因而按有关标志排队等距抽样其应用也很广泛。

等距抽样也有一定的局限性:一是调查总体的单位不能太多。因为使用这种方法时,要有一个按某一标志排列的完整的花名册,这在总体单位数太大时难以实施。二是当调查总体按照某种标志排列后,其抽样间隔如果接近个案类别的间隔时,可能会形成周期性偏差。如统计某条街道公共汽车客流量,每隔几小时抽样,其间隔恰好与上下班时间相重合,这就要影响样本的代表性。之所以会出现上述情况,是因为等距抽样比起简单随机抽样“自由度”小,一旦确定了抽样起点,一个样本就只有一个可能,不可能有其他的选择。因此,采用等距抽样法,应避免抽样间隔和研究对象本身的节奏相重合,以减少系统性或周期性偏差。

(4)整群抽样。前面介绍的几种抽样方法,都是以总体单位作为抽样单位。在实践中,总体单位数目往往很大,而各单位在时间和空间上的分布又很分散,给抽样带来很大困难。为了便于组织调查,有时可以利用现成的集体,随机地一群一群地抽取集体单位,加以研究,由此推断总体的情况。这种从总体中随机抽取一些小的群体,由所抽出的小群体内的所有单位构成调查样本的抽样方法叫整群随机抽样,简称整群抽样。例如,在进行城市居民投资意向调查时,可以以一个企业的车间、一个机关的处室、一个学校的系科作为抽样单位。采用简单随机、分类或等距方式抽选群,抽到哪一群,就对哪一群的所有职工进行调查。

由于调查的对象相对集中在一个群体中,所以调查起来方便,节省人力物力。例如,要在某市范围内调查在校大学生的思想状况,可从若干学校中抽取若干班级作调查,这比调查分散在全市各高校中同样数量的学生,要节省大量的时间与费用。整群抽样的缺点则在于样本分布过于集中,这样会降低其代表性。例如,调查城市职工工资情况,抽到某合资企业和某政府机关两个群。由于在每一个群的内部,职工工资往往比较接近,差异较小,而两个群之间的工资相差则可能很大。这种情况下,群的代表性对总体来讲就相对差一些,抽样误差也就较大。要克服这个缺点,只有缩小群间差异程度、扩大群内差异程度。因为在群内差异大、群间差异小的情况下,抽样误差是不会太大的。例如,调查某县计划生育情况,由于村与村之间的情况可能比较接近,即群间差异小,而每个村内人口生育情况却往往不相同,即群内差异较大。这时采用整群抽样就具有较高的代表性。这种情况下,整群抽样不仅组织方便,而且结果较准确,是较好的抽样方法。

(5)多阶段抽样,又称多级抽样。上述简单随机抽样、类型抽样、等距抽样等均属不分阶段的直接抽样法。即从被调查事物的总体中直接抽出所需要的全部调查单位。它们主要适用于调查规模较小、调查对象较集中的情况。而在调查对象数目庞大、分布很广的情况下,很难直接抽取调查单位,常常需采用多阶段抽样的方法,即按抽样单位的隶属关系或层次关系,把抽取样本单位的过程分为两个或两个以上阶段进行的抽样方法。具体做法是:先从总体中随机抽取若干大群(组),再从这几个大群(组)内抽取几个小群(组),这样一步步抽下来,直至抽到最基本的抽样单位为止。如要在某县抽取若干居民户进行调查,可按县—乡—村—居民户的顺序,分三个阶段抽样。第一阶段,从全县所有的乡中抽出若干个乡。第二阶段,从已抽出的乡中抽出若干个村。第三阶段,从已抽出的村中抽出若干个居民户。每一阶段都必须严格按随机原则抽取样本。这里总共有三个抽选阶段,就叫做三阶段抽样。其中前两个阶段是过渡性的,只有第三个阶段才能抽到调查单位。

这种抽样方法的主要优点:一是抽样前不需要总体各单位的完整名单,各阶段的名单数较小,故抽样工作较简便易行,适用于较大范围的、样本数较多的抽样调查。二是使用这种方法抽出的样本相对集中,便于调查的组织和调查工作的展开,节省人力、物力、财力和时间。三是采用多阶段抽样,可以使抽样方法更加灵活和多样化。在抽样调查的各个阶段可以根据具体情况分别采用各种抽样方式。例如,可以在上面抽大单位时用类型抽样或等距抽样,下面抽小单位时用简单随机抽样。其中任何一种方式,都可以用于任何一个阶段。各个阶段的抽样数目和比例,也可根据实际情况来决定。但有一点需要注意,即要在类别和个体之间保持平衡或合适的比例。尽管如此,多阶段抽样法也有其不足之处。由于每个阶段都有产生误差的可能,经多阶段抽样得到的样本,出现误差的可能性也相应增大。

2.非随机抽样

非随机抽样,又称非概率抽样,它是指根据研究者个人的方便或以个人的主观经验、设想有选择地抽取样本的方法。非随机抽样的方法主要有四种。

(1)判断抽样,又称目的抽样,即由调查者根据研究的目标和主观判断选取样本的方法。由于判断抽样是凭抽样者根据自己的判断来确定样本,故它不可能计算抽样误差。换言之,在这种抽样中,凡总体中的具有代表性的单位都可作为样本,个别单位被抽取的概率是无法确定的,其抽样结果的精确度也无法判断。所以,这种判断抽样的准确程度取决于调查者的理论修养和实际经验、调查者对调查对象的了解程度以及调查者的判断能力。如果调查者具备相应的能力,则判断抽样可望有代表性,因而有利用价值;反之,样本可能会出现各种偏差。

(2)偶遇抽样,又称任意抽样,即指调查者根据方便原则,任意抽选样本的方法。调查者可在车站附近、戏院门口、办公大楼前、街道上等公共场所访问群众,取得资料。应用这种方法,研究者所遇到的每一个分子都有可能成为样本。但它与随机抽样有一个根本的差别,即偶遇抽样不能保证总体中的每一个成员都具有同等的被抽中的概率。偶遇抽样可以由同一个人在不同地点使用,也可以由不同的人在同一地点使用。这种方法简便灵活,同时也使被调查对象感到亲切,有参与感,可以作为一种较好的民意测验方法。它的缺点是样本的代表性差,有较大的偶然性。

(3)滚雪球抽样。这种方法是找出少数个体,通过这些个体了解更多的个体。就像滚雪球一样,了解的个体越来越多,越来越接近于总体,便可以在不清楚总体的情况下了解总体。例如,美国社会学家E·古德于1967年春夏,为了研究吸毒的社会环境,先访问了二十几个大麻吸食者;访问每个人之后,请被访问者再提供其他几个吸毒者,最后共访问了204个吸毒者。在使用这种方法时,有一个前提,即总体分子之间应具有一定的联系。如果个体之间缺乏联系,那就缺乏滚雪球的依据。

(4)定额抽样(又称配额抽样)。指事先规定一定的样本容量,并规定一些与研究内容有关的标准,然后把样本容量数按不同标准加以分配,最后由调查者从符合标准的调查单位中随意地抽取样本单位进行调查。例如,某单位工作人员的学历分布如下:硕士生占职工总人数的10%,本科生占20%,大专生占30%,中专及高中生占40%。如果要对这个单位不同学历的人员的工作业绩进行定额抽样调查,当样本总数为100人时,样本分配如下:硕士生10人,本科生20人,大专生30人,中专及高中生40人。依此,调查者可根据方便与可能,按上述四类人员的样本数额展开调查。

定额抽样可能以一个标准配额,也可能以几个标准配额。例如,前例四类人员中,男性均占70%左右,女性均占30%左右,假定样本容量为100,其配额抽样数目公式为:

各种情况配额数目=样本容量×学历比例×性别比例

则:男性硕士生需调查数目=100×10%×70%=7(人)

女性硕士生需调查数目=100×10%×30%=3(人)

其余依次类推。

定额抽样简便易行,快速灵活,在民意测验、市场调查等方面经常使用。由于这种方法在抽样前将总体各单位作了分类,故其样本的代表性比简单的判断抽样要大一些。但定额抽样并不遵循随机的原则,主要凭调查人员的主观能力,故其结论用来推算总体指标的代表性不强。

总之,非随机抽样简单易行,并能通过样本大致了解总体的某些特征,见效快,通常在时间较紧、人力和物力不足的情况下采用。有时调查者无法确定总体或对调查总体并无了解,也需要用非随机抽样法对总体作出最一般的了解和接触,以进行探索性研究。由于非随机抽样的科学性较差,对总体的代表性较低,其抽样误差的控制和估算也很困难,故以非随机抽样调查的结果推断总体须十分谨慎。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈