首页 理论教育 认识抽样组织形式

认识抽样组织形式

时间:2022-02-13 理论教育 版权反馈
【摘要】:抽样组织形式是指在抽样过程中对总体的加工整理形式,常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等。简单随机抽样又称为纯随机抽样,是指不对总体作任何的分组或者排序,直接从总体中随机抽取调查单位的抽样调查方式。整群抽样中的群,主要是自然形成的,如按行政区域、地理区域等。

抽样组织形式是指在抽样过程中对总体的加工整理形式,常用的抽样组织形式有简单随机抽样、类型抽样、等距抽样、整群抽样等。

(一)简单随机抽样的含义

简单随机抽样又称为纯随机抽样,是指不对总体作任何的分组或者排序,直接从总体中随机抽取调查单位的抽样调查方式。使用该方式时总体必须满足下列条件:

(1)代表性,即要求样本(x1,x2,…,xn)中的每个x都与总体X具有相同的概率分布。

(2)独立性,即要求样本(x1,x2,…,xn)中的各x是相互独立的。

简单随机抽样是抽样中最基本的方式,它适用于均匀总体,即具有某种特征的单位均匀地分布于总体的各个部分。在以后的学习中如果不特别指明抽样组织形式,则一般都是指简单随机抽样。

(二)简单随机抽样的方法

从总体中按简单随机抽样方式组织样本有多种方法,最基本的方法是抽签法和随机数字表法。

1. 抽签法

抽签法适用于单位数较少的总体。抽样步骤为:

(1)将所有总体单位编号,通常按自然数顺序编为1,2,3,…,N。

(2)制作N个与所有总体单位编号相对应的号签,并将它们掺和均匀。

(3)根据需要按重复抽样或不重复抽样方法,从所有号签中随机抽取n个号签,与之对应的总体单位即抽中的样本单位。

2. 随机数字表法

在大规模的社会经济调查中,总体单位数往往很大,如果使用抽签法的话,制作号签的工作量势必很大,在这种情况下通常要利用随机数字表来确定样本单位。随机数字表(见附表一)是用计算机、随机数字机等方法编制出来的一种统计表格,利用它可以组合产生随机数字。在利用随机数字表确定样本单位编号时,先要按照编号位数任意确定若干行或若干列数字,然后从任意一列或行开始,组合产生随机编号。若组合成的随机数字不超过最大编号N,就是有效编号;若超过了最大编号N,就须舍弃,继续组合,直到产生n个有效编号。如果采用重复抽样方法,前面出现过的有效编号后面再出现,仍然有效;如果采用不重复抽样方法,前面出现过的有效编号后面再出现,就不再采用。

(三)简单随机抽样的平均误差

前面我们介绍的抽样平均误差计算公式,就是简单随机抽样方法的公式。

1. 重复抽样

在重复抽样方法下,抽样平均数和抽样成数的平均误差分别为:

2. 不重复抽样

不重复抽样的平均误差与重复抽样的平均误差,只相差了一个系数217-2,且在总体很大或无限时,该系数可表示为217-3a。此时抽样平均数和抽样成数的平均误差分别为:

类型抽样的含义

类型抽样又称分层抽样或分类抽样。它是先对总体各单位按主要标志加以分组,然后再从各组中按随机原则抽取一定数量单位构成样本的抽样组织方式。

类型抽样适用于总体各单位在被研究标志上有明显差别或差别悬殊的情况。例如,研究农作物产量时,耕地有平原、丘陵和山地等;研究职工的工资水平时,各行业之间有明显的差别;等等。类型抽样实质上是一种把统计分组和抽样原理有机结合起来的抽样组织方式。通过分组,使组中具有同质性,组间具有差异性,然后从各组中简单随机抽样。这样可以保证样本对总体具有更高的代表性,计算出的抽样误差也就比较小。类型抽样应遵循的主要原则是:分组时,应使组内差异尽可能小,组间差异尽可能大。

(二)类型抽样的方法

按照在各组中的抽选比例是否相等,类型抽样可分为等比例抽样和不等比例抽样两种。

1. 等比例抽样

等比例抽样就是按同样的抽样比例n/N,确定各组中应抽取的样本单位数。假如组数为m,各组单位数分别为Ni(i=1,2,3,…,m),从中抽取的样本单位数分别为ni(i=1,2,3,…,m),则ni/Ni=n/N。

2. 不等比例抽样

不等比例抽样是指不按同一抽样比例确定各组中应抽取的样本单位数,即ni/Ni(i=1,2,3,…,m)不完全相等。当某类单位在总体中占的比重过小时,按照等比例方法抽不到或只能抽到很少这样的单位,为了保证样本的代表性而应采取不等比例抽样的方法。

(三)类型抽样的平均误差

抽样平均数:

以上公式中,218-2表示各组组内平均数,218-3表示各组组内方差218-4表示组内方差的平均数。

例7-13 某乡耕地20 000亩,按平原和山区面积等比例抽取400亩组成样本。各组平均亩产和方差如表7-1所示。求抽样平均亩产和抽样平均误差,并以95%的概率估计该乡全部播种面积平均亩产的置信区间

表7-1 某乡某种粮食播种面积资料

当置信度1-α=95%时,临界值μα/2=1.96,则:

抽样平均亩产的极限误差:

即可以95%的概率保证该乡农作物的平均亩产为486.71~507.29千克。

(一)等距抽样的含义

等距抽样又称机械抽样或者系统抽样。它是先将总体单位按某一标志排序,然后按照固定的顺序和相同的间隔来抽选样本单位的抽样组织方式。

例如,若N=200,n=20,则抽样间隔265,即平均每10个总体单位中抽取1个样本单位。

等距抽样的随机性体现在第1个样本单位的抽取上,在抽取这一个单位时,要绝对遵循随机原则;当这一个单位的位置确定后,以后各个样本单位的位置也就确定了。如上例中,若随机抽出来的第一个单位位于第8个位置上,则后面的样本单位的位置分别就是18,28,38,…,198。

按等距抽样组织方式抽取样本单位,能够使抽出的样本单位更均匀地分布在总体中,因此,其抽样误差一般较简单随机抽样要小,特别是当研究的总体单位标志变异程度较大时,更能显示出等距抽样的优越性。

(二)等距抽样的方法

按照排序标志和被研究标志是否相关,等距抽样可以分为无关标志排序抽样和有关标志排序抽样两种。

1. 无关标志排序抽样

无关标志排序抽样是指排序的标志与被研究的标志无关。如观察学生考试成绩,按照姓氏笔画排序;观察产品的质量,按照生产的先后顺序取样等。无关标志排序抽样可以保证抽样的随机性,它实质上相当于简单随机抽样。

2. 有关标志排序抽样

有关标志排序抽样是指排序的标志与被研究标志相关。如农产品产量调查时,将地按过去连续几年的亩产排序;家庭消费水平调查中,按收入额排序等。按有关标志排序可以利用辅助的信息,使抽样估计的效率提高,但必须采用科学的方法,避免由于抽样间隔与排序标志的周期性变化的重合所产生的系统性误差。

(三)等距抽样的平均误差

等距抽样均为不重复抽样,按无关标志排序时,抽样平均误差可参照简单随机不重复抽样的公式计算;按有关标志排序时,抽样平均误差可参照类型抽样的公式计算。

例7-14 年终在某储蓄所按定期储蓄存款进行每隔5户的等距抽样,得到表7-2所示的资料。试以95.45%的概率估计平均定期存款额的范围。

表7-2 某储蓄所定期储蓄存款资料

由题意知:n=484户,g=5,1-α=95.45%,则:

N=484×5=2 420(户)

μα/2=2

即该储蓄所平均定期存款额为411.91~442.63百元,可靠程度为95.45%。

(一)整群抽样的含义

整群抽样也叫分群抽样或集团抽样,是按照某一标志将总体划分为若干群,然后以群为单位从中随机抽取部分群,对中选群中的所有单位进行全面调查的抽样组织方式。

在大规模的抽样调查中,如果总体单位多,且分布区域广,缺少进行抽样的抽样框,或按经济效益原则不宜编制某种抽样框的情况下,宜采用这种形式。因为整群抽样将抽样单位由总体单位扩大到群,所以它的抽样框是很简单的。例如,对某市居民的家庭收入进行调查,采用整群抽样,就可以按行政区域分为街道,然后随机抽取一些街道,进行全面调查。

整群抽样中的群,主要是自然形成的,如按行政区域、地理区域等。由于整群抽样的样本单位集中于群内,所以同样条件下,其样本较简单随机抽样的样本代表性要较差,因此应适当增加样本单位数,以提高估计的精确度

(二)整群抽样的平均误差

设总体中的全部单位被划分为R群,每群中所包含的单位数为m,现从所有群中随机抽取r群组成样本。则各群的平均数为:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈