首页 百科知识 抽样调查方案涉及的样本单位是指

抽样调查方案涉及的样本单位是指

时间:2022-03-14 百科知识 版权反馈
【摘要】:第一节 抽样的基本概念一、抽样法及其特点抽样法,就是在一定条件下从统计总体中抽取一部分单位进行研究,用以推断总体,达到对总体的认识的一种统计方法。一般来说,有意抽样能够取得较满意的结果,但是,却不能像随机抽样那样进行必要的统计分析。遵守随机原则的目的是使所抽取的样本保持与总体相似的结构,保证样本的代表性,减少抽样误差。随机原则是抽样推断的基础。
抽样的基本概念_统计学教程

第一节 抽样的基本概念

一、抽样法及其特点

抽样法,就是在一定条件下从统计总体中抽取一部分单位进行研究,用以推断总体,达到对总体的认识的一种统计方法。抽样方法是现代统计学的重要组成部分,它既是统计调查的方法又是统计分析的方法,二者有机结合形成了一种崭新的认识方法,在社会各个领域得到了广泛的应用。在社会经济领域,人口变动情况调查、农产量调查、产品市场调查以及民意测验等;在自然科学领域,对自然环境的调查、科学试验等,都需要抽样方法。

自总体中抽取样本的方法有两种:一种是随机抽样,也叫概率抽样,即按随机原则从全部研究对象中抽取部分单位进行实际调查,并依据样本信息对总体数量特征做出具有一定可靠程度的估计判断,从而达到对总体的认识;另一种是有意抽样,也称有鉴别抽样,属于非随机抽样,即抽样人根据自己对事物的了解,从总体中有目的地抽取一些单位作为样本。一般来说,有意抽样能够取得较满意的结果,但是,却不能像随机抽样那样进行必要的统计分析。本章所讨论的抽样方法指的是前者,即随机抽样。随机抽样方法具有以下基本特点:

(一)遵循随机原则抽取样本

所谓随机原则,表现在抽取样本时必须保证总体中每个单位的中选与否不受任何主观因素的影响,而完全由随机因素来决定。同时,还要保证总体中每个单位具有相同的中选可能性。遵守随机原则的目的是使所抽取的样本保持与总体相似的结构,保证样本的代表性,减少抽样误差。随机原则是抽样推断的基础。

(二)随机抽样是由部分推断整体的一种研究方法

抽样调查是一种非全面调查,但它不同于其他非全面调查,其他非全面调查不能从数量上推断总体,而抽样法以概率论为理论依据,抽取足够的样本单位,使样本统计量成为总体参数的较好估计量,以达到对总体数量特征的认识。

(三)随机抽样可以对抽样误差进行控制

利用样本数据推算总体数量特征会产生抽样误差,但是,利用概率理论可以事先计算抽样误差,并可根据问题的需要将误差控制在一定范围内,以保证抽样推断具有适当的准确度。

二、抽样法的应用

由于抽样方法比全面调查方法具有省时、省力,且有较好的准确性及便于组织等优点,使得其应用范围日益广泛,概括起来主要表现在以下几个方面:

(一)对某些不可能进行全面调查,但又需要了解全面情况的现象

一种情况是总体无限大,如气象调查、新设备新材料功能检查等;另一种情况是总体范围过大,如森林木材积蓄量调查,对某种新产品的市场需求量调查等;还有一种情况是具有破坏性的产品质量检验,如轮胎里程试验、金属材料力学性能检验等。这些情况均不能进行全面调查,必须采用抽样调查方法。

(二)没有必要进行全面调查的情况

有些现象,如民意测验、家计调查等,通过进行合理的抽样调查方案设计,采用抽样调查的方法即可达到与全面调查相当的效果,同时还可节省人力、物力。因此,对于这类现象来说,虽可进行全面调查,但采用抽样调查方法具有独到的功效。

(三)抽样调查与全面调查结合使用

抽样调查与全面调查相结合,可以发挥相互补充和检查质量的作用。抽样调查是在小范围内进行的,数字较准确可靠,可以用来订正全面调查资料。例如,我国人口普查中,在普查填报和复查工作完毕后,按照规定抽出一定比例的人口数,重新进行调查,用以测算普查的重复和遗漏的差错率,据此修正普查数字。此外,有些国家在进行人口和工业调查中,根据调查项目的粗细要求不同,分别进行普查和抽样调查,由这两种调查所得的资料不但可以相互核对差错,而且可以满足不同的需要。

(四)用于工业生产过程的质量控制

对于成批或大量连续生产的产品生产过程,通过抽样方法可以及时提供有关产品质量信息,分析各种可能的原因,以便采取措施,排除故障,使生产过程保持正常,从而起到对生产过程进行质量控制的作用。

随着抽样理论的发展及抽样技术的进步,抽样法的应用将更加普及和广泛。然而,抽样调查也有其局限性,它并不能代替全面调查及其他非全面调查方法。

三、抽样组织方式

(一)简单随机抽样

简单随机抽样(Simple random sampling)也称纯随机抽样,是按随机原则直接从总体中抽取n个单位作为样本,并利用样本指标对总体相应指标进行统计推断的一种抽样方法。简单随机抽样是最简单而又最基本的抽样组织方式,是设计其他复杂抽样形式的基础。

简单随机抽样,首先要将总体各个单位进行编码,然后按随机原则抽取若干数码,所有中选数码所对应的单位即构成样本。样本单位的抽取具体有以下几种方法:

1.抽签法。当给总体各单位编号后,把号码写在结构均匀的签上,将签混合均匀后即可从中抽签。采用这种方法简便易行,然而对较大的总体来说,编号做签工作量很大,且混匀有困难,因此,这种方法的应用有一定局限性。

2.随机数字法。随机数字可以借助于计算机获得,也可应用随机数表,其中随机数表方法应用较为普遍。随机数表形式见表5-1。表中数字是按照完全随机的方法产生的,从0~9中任何一个数字出现的概率与其他数字出现的概率完全相同,任何一组数字出现的概率与其他组出现的概率也是完全相同的。表5-1是多种随机数表中的一种。

表5-1   随机数表(部分)

img215

随机数表的使用要遵守随机原则。首先,给总体编号,根据编号的最大位数确定将要使用随机数表的列数,然后从表中任意一列、任意一行开始,向纵向或横向划线取数,遇到属于总体单位编号范围内的数组就确定为样本单位,然后继续往下找。如果要求不放回抽样时,遇到重复出现的数组就弃之,直到取足要求的单位数为止。

例如,有一个由60个单位构成的总体,现在要从中抽取6个单位。首先将总体编号,从1~60,故最高位是两位数,然后随机确定行、列开始取数,假定从第3列第1行开始取,于是有43,24,56,17,12,07,这六组数字所对应的单位即构成所需的样本。

采用随机数字法虽然需要编号,但省去了做签和混匀工作,因此,比抽签法使用方便。

简单随机抽样方法适用于均匀总体,即具有某种特征的单位均匀地分布于总体的各个部分。由于这种方法要求对总体各个单位编号,因此,不适用于总体单位数过多的情况。

(二)分层抽样

分层抽样(Stratified sampling)不是直接从总体中抽取样本,而是先把总体按一定标志划分成若干性质相近的层或组,然后再按随机原则从各组中抽选一定的单位组成样本。设总体由N个单位构成,将其分为k组,使N=N1+N2+…+Nk,然后从每组中的Ni个单位中抽取ni个单位,使n=n1+n2+…+nk,这样就得到了样本n。

分层抽样的特点是:第一,通过可以利用的资料事先对总体有一定的认识,选择影响抽样结果的主要因素作为分层标志。第二,由于总体是按主要影响因素分层的,因此,各组内单位标志值的差异相对较小,这样各组的样本ni能较好地代表本组总体Ni的情况。第三,由于总体各组都有抽取样本单位的机会,且各组的样本又能较客观地反映本组情况,因此,整个样本n对总体的代表性也好。所以,当总体各单位标志值差异较大时,选用分层抽样比使用简单随机抽样可以减少抽样误差,从而得到更有效的结果。

从总体各组中抽取样本单位的方法,可以按各组单位数在总体中所占的比例来分配抽样单位数,然后按所分配的单位数在各组中抽样,即等比例抽样;特殊情况下也可以采用不等比例抽样。

(三)等距抽样

等距抽样(Systematic sampling)也叫做系统抽样,它是将总体全部单位按某一标志排队,然后按固定的顺序和间隔抽取样本的一种方法。设总体有N个单位,现需抽取容量为n的样本,其具体做法是:

将总体N个单位按一定的标志排队,然后将其分成n个相等的部分,即每个部分均包含k个单位。自第一部分的k个单位中随机抽取第i个单位,作为这一部分的样本单位,自第二部分中抽取第k+i个单位,然后依次往下抽,每个单位与上一单位的间隔均为k。各部分均抽完以后即得到n个样本单位。此法可用图5-1表示。

img216

图5-1 等距抽样示意图

等距抽样中总体各单位排队时,可以按无关标志排队,也可按有关标志排队。所谓按无关标志排队是指用于排队的标志与所调查指标没有直接联系,或者关系较小。如在职工家计调查中,按职工花名册或姓氏笔画顺序排队;在流水生产线上进行产品质量检查时,按时间顺序取样等,均属于按无关标志排队。按有关标志排队是指用于排队的标志与所调查的指标有密切的关系。如在职工家计调查中,按职工工资水平进行排队,这里工资是职工收入的主要部分,因此与所要调查的指标有直接的关系。

等距抽样法的最大特点是,首先组织简便、易于实施,只要确定了抽样间隔和起点,整个样本的所有单位就都确定了。其次,当按有关标志排队时,能保证样本单位在总体中均匀地分布,所抽样本对总体代表性好,利于降低抽样误差。然而,等距抽样法也有其不足之处,即样本各单位只有第一个单位是随机抽选的,而其余单位均是按固定间隔依次抽取的。这样,若第一个样本抽取不当,将易产生系统误差。如抽样间隔恰好与总体本身的周期相吻合时,就易产生系统误差。

(四)整群抽样

整群抽样(Cluster sampling),就是先将总体各单位划分成若干群,然后以群为“单位”从中随机抽取部分群,并对所抽中群的群内所有单位进行全面调查。整群抽样时群的划分要满足两个条件:一是群与群之间没有单位重叠;二是总体中每一个单位都必须属于某个群,即使总体单位无遗漏。一般来说,群的划分多是自然形成的,如学校、企业、村庄等自然群;也有人为划分的,如产品以箱为群、生产线上每5分钟的产品为一群,等等。

整群抽样法的优点是:第一,抽样设计和组织比较方便,如在无法事先掌握总体各单位全部情况的场合,因为整群抽样以群为单位,所以不必对总体中所有单位逐一编号即可抽样。第二,节省人力、物力。由于整群抽样每抽一群即包含若干总体单位,因此,可相对容易地取得样本总体。

但是,由于整群抽样法的调查单位相对集中,所得样本的单位不是从总体中均匀抽出,这样使样本对总体的代表性不理想。因此,整群抽样与其他抽样方法比较,在样本量相同的条件下,整群抽样所产生的误差要相对大一些。在实践中,往往利用整群抽样组织方便的特点,适当抽取相对多一些的单位进行调查,以减少抽样误差。在实际工作中,整群抽样方法应用范围较广,如人口调查、家计调查、林业牧业调查以及产品质量检查等都常使用这种方法。

(五)阶段抽样

前面所讨论的抽样调查方法是从总体中一次直接抽出所需要的全部调查单位,即只有一个抽样步骤,故叫做单阶段抽样。单阶段抽样的程序简单,抽样误差也容易计算。然而在组织大规模抽样调查时,由于总体很大且单位分散,往往不是一个阶段所能完成的,必须采取两阶段或多阶段抽样的方法。

所谓两阶段或多阶段抽样(Multistage sampling),就是把抽取样本单位的过程分为两步或两步以上来进行。例如,对某个城市的居民进行家庭收支调查,一般至少要分两个阶段来进行。第一步,从全市的所有街区中抽取若干街区;第二步,自每个抽中的街区再抽取若干居民户,由所有抽中的居民户组成样本。这里抽取样本单位有两个步骤,就叫做两阶段抽样。又如,我国的农产量调查通常有四个步骤:第一步是从省抽县;第二步从抽中的县中抽取村;第三步再从抽中的村抽地块;第四步是再从地块抽具体的样本点,所有的样本点组成样本。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈