首页 理论教育 抽样调查的一般步骤

抽样调查的一般步骤

时间:2022-03-13 理论教育 版权反馈
【摘要】:因而,在进行抽样时,就必须事先作出一些规定。如在人口生育的调查中,每个抽样单位应是一个人。这种情况下,应在调查前对抽样单位加以确定。要得到一个良好的抽样框是不容易的。例1在一个拥有10万职工的城市进行职工收入状况调查。经小规模试验性调查,得知职工平均月收入为1 000元,标准差为250元。
抽样调查的一般步骤_现代社会调查方法

三、抽样调查的一般步骤

抽样调查是由点及面的调查方法,为了保证达到以样本推断总体的目的,对于程序要求非常严格。

(1)界定总体。即根据研究课题要求,把所调查的对象的范围确定下来,从而确定抽取样本的对象和依据样本作出推断的范围。例如,1988年全国千分之一生育率调查对总体定义如下:

1988年7月1日零时全国(除西藏、台湾外)29个省、市、自治区所有15—67岁的妇女。

一般说来,界定总体不至于发生问题。例如,从一批冰箱产品中抽样来检验冰箱的性能时,总体易于界定。但在实际调查中,也会出现一些难以界定的情况。诸如在家庭调查中,单身户是否可以算为家庭等等。因而,在进行抽样时,就必须事先作出一些规定。正常的情况应该是调查员在现场能毫不犹豫地确定一个可疑的情况是否属于调查的总体。

要从中抽取样本的总体(称作被抽样总体)必须与要得到信息的总体(称作目标总体)完全一致。有时,为了实用与方便,被抽样总体在范围上比目标总体受到较多的限制。在这种情况下,如果要把这些结论运用到目标总体,就必须以其他来源的信息为补充。

例如,要了解中学生作业负担,到几所重点学校抽样调查,得到的结论只能说明重点学校,不能说明该地区所有学校的情况。因为重点学校与非重点学校在学生学习负担方面有差别。而要了解非重点学校学生的学习负担,就必须在非重点学校中作抽样调查,并以此为补充来说明整个中学生作业负担的情况。

(2)选择适当的抽样方法。抽样方法可分为两大类:随机抽样法和非随机抽样法。调查者可根据研究目的和要求,结合要研究的总体的具体情况,选取不同的抽样方法。

(3)确定抽样单位,编制抽样框。抽样单位,就是总体中的每一个最基本抽样对象。如在人口生育的调查中,每个抽样单位应是一个人。在一个总体中,各个抽样单位必须互不重叠并且能合成总体。也就是说,总体中的每个个体属于而且只属于一个单位。有时候,单位是非常明显的。例如,在育龄妇女总体中,单位就是一个个育龄妇女。有时,单位是要进行选择的。例如,进行群众生活水平抽样时,单位可以是个人,也可以是家庭。这种情况下,应在调查前对抽样单位加以确定。

一个完整的抽样单位一览表叫做抽样框。一般地说,样本是从抽样框架中抽取出来的。要得到一个良好的抽样框是不容易的。通常抽样框是不完全的,或有一部分是模糊不清、难以辨认的,或含有未知的重复部分。例如,就人口调查而言,制定完全准确的抽样单位一览表是不可能的,每天都有人出生和死亡;还有,人们可能更换住址,或提供错误的地址和电话号码。特别是作较大规模的调查(对一个城市的调查),因调查包含易变的总体(如移民),建立充分良好的抽样框是比较困难的,并且在时间和金钱上的花费都很大。较好的解决办法是列出家庭或住所的地址,以此作为抽样框架,从中抽取样本。因住所是比较稳定的,这样不会发生遗漏等问题。

(4)确定样本的大小。样本大小是指样本中含有单位的多少。确定抽取多少样本,是一个非常重要的问题。抽样数目过多,就会多花人力、物力、财力,造成浪费;抽样数目过少,又会使调查结果发生较大的误差,不能保证样本对总体的代表性,也就不能对总体作出正确的推论。

确定样本大小需考虑的因素主要有:(1)调查总体的规模大小。一般来说,调查总体的规模越大,所需样本数量就越多。(2)调查总体内部的差异程度。总体内各单位的差异程度较大的,样本数量应多一些;反之,样本数量就可少一些。(3)对调查结果的可信度与精确度的要求。要想使调查结果有较高的可信度(把握程度)和较小的偏差度,样本数量应多一些;反之,则可少些。

根据统计学的要求,样本数量一般不能少于30(也有人认为不能少于50)。由于社会调查大多涉及的范围较广,总体中各方面的情况较复杂,故社会调查中抽取样本的数目一般比统计学的要求还要多一些。

在理论上,抽样数目是可以用公式进行计算的[1]。如:在重复抽样(指从总体中随机抽取一个单位之后,又把它放回总体之中,再从总体中抽取单位的方法)的条件下,简单随机抽样所需样本的计算公式为:

img24

其中:

Z为某一信度(如95%)所对应的临界值(如1.96)(见本书附表2),

σ为总体标准差,

Δ为误差范围。

信度系数和误差范围通常由调查者自己确定,总体标准差可以利用该总体过去的资料、其他类似总体的资料、或者试验性调查的资料来估计。

例1

在一个拥有10万职工的城市进行职工收入状况调查。经小规模试验性调查,得知职工平均月收入为1 000元,标准差为250元。现要求可信度为95%,允许误差为2%,问在全市范围内用简单随机抽样方法,应当调查多少名职工?

解:根据正态分布概率表(见本书附表2),信度95%(也即0.05)所对应的Z值为1.96。另外,已知σ=250元,Δ=1 000×2%=20(元),

在重复抽样中:

img25

即,在简单随机重复抽样中,需要抽取600人进行调查。

由于在抽样调查之前,总体平均数和标准差通常是未知的,故利用上述公式计算抽样数目往往并非切实可行。在实际的抽样过程中,样本数目一般是根据统计学家的研究成果大致上确定的。如,在一个较大范围内(如一个城市)抽取600个样本,就能使统计结果达到95%的信度和不超过4%的偏差度(见表5-1),一般说来,这样也就可以了。

表5-1 较大范围内的抽样选择方案

img26

样本数目并不一定要与总体所包含的数目成比例。在一定的范围内,样本数的多少对统计结果会有显著的影响。但当样本数大到一定程度时,再增加其数量,对统计结果的影响就不大了。例如,只要严格按随机原则抽样,在一个城市中抽取1 000个职工来推断全市职工的平均收入与抽取10 000个职工作出推断的准确程度和可靠程度是相差不大的。总之,在确保样本数能足够代表总体的前提下,应以选择较小样本容量为宜。

(5)收集、整理和分析样本资料。这一步的任务是集中所有样本的实际资料,尽量减少和避免登记性误差。获取到样本资料后,应着手进行审查、整理、分析,通过电子计算机进行编码整理,运用数理统计手段来分析样本资料,进而推断总体,找出样本对于总体的代表性、准确性程度,找出抽样误差,得出调查结果。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈