首页 百科知识 抽样调查问卷通知怎么写

抽样调查问卷通知怎么写

时间:2022-08-27 百科知识 版权反馈
【摘要】:抽样调查也叫实地调查,是一种社会学的研究方法,后来成为传播学研究的常用方法之一。表8-1给出的数据显示了抽样调查时的样本容量与置信水平、置信区间之间的关系。抽样调查的目的是“调查部分以了解总体”,其运作原理是根据样本的特征统计值来推论总体的参数值特征。样本规模是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。

第一节 抽样调查法

抽样调查也叫实地调查,是一种社会学的研究方法,后来成为传播学研究的常用方法之一。传播学的研究对象通常是某一群体,而往往群体的数量是庞大的,需要收集的数据类型和数据量也十分庞杂。例如,我们要研究武汉市居民报刊阅读习惯,通常情况下是无法做到对全体武汉市民进行问卷普查或者逐个访谈的,一是由于时间有限,二是研究经费及人员配置都很难达到如此高的标准。在这种情况下,研究者往往需要从研究对象群体中抽取一些样本(sample)进行研究。

抽样调查在社会学、政治学、经济学、传播学等领域,都得到了广泛的应用。一些国家的中央政府大量采用抽样调查来了解其就业与失业、收入与支出、住房状况、教育、营养等方面的情况。调研机构利用民意测验观测各种现实问题的公众舆论。

一、方法简介

1.抽样的概念

1)总体(population)

总体是构成它的所有元素(element)的集合,而元素(element)则是构成总体的最基本的单位。总体是具有某种统计特征的一类事物或者人群的全部个体的总称,在调查中通常用符号N表示。

例如,要对《人民日报》2011年上半年的头版内容进行研究,那么这段时间内《人民日报》头版上的所有文章就构成了研究的总体。而其中的每一篇文章都是构成这个总体的元素。

2)样本(sample)

样本是从总体中按一定方法抽取的一部分元素的集合,它可以看做总体的子集。样本也可以指从总体中按照一定方法抽取出来的每一个元素。比如,要从《人民日报》2011年上半年的头版中抽取6周的新闻作为研究对象,那么这6周内的所有新闻就构成了研究样本的集合,每一条新闻都是研究的一个样本。

3)抽样(sampling)

抽样是指从总体的所有元素集合中,按照一定的方式选择样本的过程。比如,从论坛中的100000个帖子中,依据某一种抽样方法,抽取1000个帖子作为分析样本;或者从某高校的10000名在校学生中,依据一种抽样方法选择300名学生作为调查样本。

4)抽样单位(sampling unit)

抽样单位是从总体中抽取出来的基本单位,抽样单位与构成总体的基本元素可能并不一致。比如,从一个城市的所有市民中,抽取2000个市民,那么其中的每个市民既是构成全部市民总体的元素,又是我们抽取的2000个样本的抽样单位。再比如,当我们从这个城市中抽取600户家庭,以这600户家庭中的所有成员作为研究的样本,则抽样单位(家庭)与构成总体的元素(市民)就不一样了。

5)抽样框(sampling frame)

抽样框又叫做抽样范畴,它是从总体中一次直接抽样得到的抽样单位的清单。比如,从一所中学抽取200名学生作为样本,则这200名学生的名单就是这次抽样的抽样框。

6)参数值(parameter)

参数值也叫做总体值,它是关于总体某一变量的描述,或者是总体某种特征的综合数量表现。要得到总体的参数值,需要对总体中的每一个元素都进行测量或研究,但经费及人力的限制等客观条件常常使我们无法做到。因此,只能通过样本的统计值推断总体的参数值。

7)统计值(statistic)

统计值也叫做样本值,它是整个调查样本中某一变量的综合描述,或者是调查样本的某种特征的综合数量表现。样本值是样本的所有元素估算得到的结果,是相应的总体值的估计量。例如,样本的平均网龄这一统计值,是通过对所有样本的网龄进行加总平均后计算得到的。

抽样的目的之一,就是通过样本的统计值去推算总体的各种参数值。由于对每一个总体进行抽样时,即使是采用相同的抽样方法,也会得到不同的样本,因此每一个样本的统计值都只是总体参数值的估计量,它们或多或少地存在一定的偏差。而进行抽样设计,就是尽可能地使抽取的样本的统计值接近总体的参数值。

8)抽样误差(sampling error)与非抽样误差(non-sampling error)

抽样调查中的误差可以分为两类,一类是抽样误差,另一类是非抽样误差。

抽样误差是指由于抽样本身的随机性,而导致的用样本的参数值推论总体值时的误差。因为样本只是总体的一部分,用部分样本数据估计总体数据,不可能完全相同,因此抽样误差是不可避免的,但可以通过合理的抽样方法加以控制,使它尽可能减小。

非抽样误差是指除抽样误差以外的,由于各种原因而引起的误差,在各种方式的调查中都存在。产生于抽样调查的各个环节,即调查及抽样设计、调查实施与数据采集以及数据的汇总分析与处理等过程中。

9)置信度(confidence level)与置信区间(confidence interval)

置信度又称置信水平,它是指总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间中的把握性程度。它反映抽样的可靠性程度。比如,置信度为95%,则说明总体参数值落在样本统计值某一区间的概率为95%,或者说,我们有95%的把握认为,总体参数值将落在样本统计值周围的某一区间内。

置信区间是指在一定的置信度下,样本统计值与总体参数值之间的误差范围,它反映抽样的精确性程度。置信区间越大,误差范围越大,抽样的精确性程度就越低;反之,正好相反。

很显然,当置信区间扩大时,置信度将会相应增加。置信度和置信区间提供了决定研究样本大小的基础。当研究者决定了可以允许的抽样误差范围时,便可以依此范围计算出所需的样本的大小。比如,一项研究希望有95%的把握让研究结果与总体参数值的差值在±5%的范围内,那么,样本容量至少需要400。表8-1给出的数据显示了抽样调查时的样本容量与置信水平、置信区间之间的关系。

表8-1 样本容量与置信水平、置信区间的关系

img35

2.抽样调查的特点

抽样调查的目的是“调查部分以了解总体”,其运作原理是根据样本的特征统计值来推论总体的参数值特征。我们知道,每一项研究都会受到时间、人力和经费的限制而无法实现全部个体的全面普查,从而不得不在庞大的总体中抽取一定数量的样本进行研究。为了确保抽样调查的数据能够用来代表和推算总体,抽样调查的样本必须注意以下准则

(1)随机性原则。随机性原则即构成总体的每个元素或单位被抽取的机会是均等的。因此,能够保证被抽中的单位在总体中的均匀分布,代表性强,也不致出现倾向性误差。

(2)科学的抽样技术。根据研究对象的特点,要采用合适的抽样技术以获得有代表性的样本。

(3)合适的样本规模。样本规模是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。

(4)可控的抽样误差。抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,这样的话调查结果的准确程度就会较高。

抽样调查与普查、典型调查和个案调查等方法相比,具有许多优点。

(1)调查费用和人力消耗较少。使用这样的方法,减少了需要调查的对象,使抽样调查比整体调查节省时间、人力和物力,可以使调查人员素质得到保障,从而提高调查和研究的质量。

(2)调查的精确度较高。虽然从理论上说,普查的精确性比抽样调查要高,但在实际的调查研究中,常常会遇到总体数量庞大的普查任务,比如我国的人口普查,动辄需要成千上万的人员,而这些人员的素质参差不齐,调查数据的可信度与结果的精确性往往打了折扣。抽样调查由于工作量相对较少,可以使用素质较高的调查人员,并进行专门的充分的培训,从而保证调查结果的精确性。抽样调查所依据的是概率论原理,即在总体中被抽作样本的个别单位虽各有差异,但当抽取的样本单位足够多时,个别单位之间的差别会趋于相互抵消,因而“样本”的平均数接近总体平均数,以部分可以说明总体[1]。例如,投一枚硬币,得到的可能是正面,也可能是反面。但是,经过长期的实验和观察的结果发现,得到正面和反面的比例均为1/2。

(3)调查的速度快。抽样调查使得调查研究的工作量减少,调查的速度自然也会提升。所以对于一些时效性较强的调查,通常采用抽样调查的方法进行。

(4)调查的结果具有可推断性。抽样调查的一个基本特征就是可以依据样本的结果推断总体,依据概率理论,可以知道这种调查结果的可信度有多高。

3.抽样调查的类型

按照抽样方法是否符合概论原理,抽样调查可以分为概率抽样和非概率抽样。

1)概率抽样(probability sampling)

概率抽样是按照随机原则进行的抽样,组成总体的每个元素或单位被抽中的概率相同。采用概论抽样技术可以有效避免样本出现系统性偏差,样本对总体有很强的代表性。因此概率抽样仍然是社会科学研究中选取大型和具有代表性样本的重要方式。

概率抽样的关键在于保证总体中的每一个个体都有同等的机会入选样本,即要保证抽取的过程是随机的。它主要包括简单随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样等。

(1)简单随机抽样(simple random sampling)。

简单随机抽样又称完全随机抽样,是概率抽样的最基本形式。它是从总体中不加任何分组,完全随机地抽取调查单位。完全随机抽样中,每一个单位被抽取的机会都是均等的。

简单随机抽样有两种常用的方法,即抽签法和随机数字表法。

抽签法:将总体单位按照1—N编号,将这些号码写在一张张小纸条上,打乱顺序放入暗盒中,搅拌均匀,然后不加任何选择地从中任意抽取样本,直到数量到达所需的样本数量为止。

随机数字表法:首先根据总体单位数指定随机数字表中多少数字连成一组;其次随机地决定以某行某列的数字为起点,然后从左向右或者从上向下地查出数字,与查出的数字相同的总体单位编号即为样本。如果遇到重复的号码或者超出总体数的号码则舍弃不用,补充其他的号码,直到抽满一定数目的样本为止。[2]

简单随机抽样的优点在于,研究人员不需要对研究总体做过多的调查,他们可以方便地找到一组具有代表性的对象,排除了分类带来的误差。

(2)系统抽样(systematic sampling)。

系统抽样又称为等距抽样或者机械抽样。它是将总体各单位按照一定的次序进行排列,再计算出某种间隔,然后按照这一固定的间隔抽取样本单位。系统抽样和简单随机抽样一样,需要有完整的抽样框,样本的抽取也是直接从总体中抽取元素,而无其他中间环节。

系统抽样的具体做法是:

首先,将总体中的所有元素按照某一顺序编号;

其次,用总体规模除以样本规模img36(其中K为抽样间距,N为总体规模,n为样本规模);

再次,从编号为1—K的个体中随机确定一个个体为抽样的起点,记为S,自S开始,每隔K个个体就抽取一个,即所抽取的个体的编号为S,S+K,S+2 K,…直到抽满所需要的样本数量为止;

最后,将所有抽取的个体合起来,就是一个样本。

(3)分层抽样(stratified sampling)。

分层抽样又称为类型抽样或者分类抽样,它是将总体中的所有元素按照某种特征或者标志(如性别、年龄、职业、教育程度等)划分成若干类型,然后在各类中采用简单随机抽样或者系统抽样的办法抽取一个子样本,最后,将这些子样本合起来就构成了总体的样本。在分层抽样中,被划分成的类就叫做“层(stratum)”。

分层抽样的具体做法如下。

第一,按照某一种或者某几种特征对总体进行分层。比如,按照性别、年龄、职业、受教育程度等将研究总体划分为几个群体。一般来说,研究者应该选择对调查中的测量现象有很大影响的因素作为分层标准。比如,调查某公司职工购买书籍的情况,考虑到“文化程度”是影响职工购书的重要因素,便可将“文化程度”作为分层的标准。

第二,确定在各层中抽取样本的数量。此时,可采用等比例和不等比例抽样两种方法进行。等比例分层抽样,是指各层在样本中所占的比例与它们在总体中所占的比例相同,这种方法使用得较为普遍。不等比例分层抽样,一般用于各层的单位数量相差悬殊,若仍按照等比例抽样,可能会因为某一层的样本数量太少而难以代表该层的实际情况。比如,某高校有学生10000人,本科生、硕士生和博士生的比例为6∶3∶1,若在该校抽取一个100人的样本,则博士生只能取10人,数量太少。此时,我们就可以使用不等比例抽样,将本科生、硕士生和博士生均抽取33人。需要注意的是,这是一个非概率抽样,在对统计结果作推断时,需要进行加权处理。

(4)整群抽样(cluster sampling)。

整群抽样又称为区域抽样,它与前几种抽样方法的最大区别在于,它的抽样单位不是单个的个体,而是一个群体。它是从总体中随机抽取一些小的群体,由这些小群体中的所有元素构成研究的样本。比如,某大学有100个班级,每个班级有30名学生,要从这3000名学生中采用整群抽样的方法挑选300名作为样本。则需要从100个班级中抽取10个班级,由这10个班级的全部学生构成调查所需要的样本。

整群抽样的显著优点在于,它能够简化抽样的过程,极大地节省时间和经费,同时还能够相对地扩大抽样的应用范围。但是,整群抽样的这些优点是以其分布面不广、样本相对于总体而言代表性较差为代价的,增加了产生误差的机会。

值得注意的是,当总体是由若干个有着自然界限和区分的子群(或类别、层次)所组成,同时,不同子群相互之间差别很大,而每个子群内部的差别不大时,适合于分层抽样的方法;反之,当不同子群相互之间差别不大,而每个子群内部的异质性程度较大时,适合采用整群抽样的方法。[3]

(5)多阶段抽样(multi-stage sampling)。

多阶段抽样又称多级抽样或者分段抽样。在调查对象数目庞大、分布很广的情况下,很难直接抽取调查单位,常常需要采用多阶段抽样的方法,即按照抽样单位的隶属关系或者层次关系,把抽取样本单位的过程分为两个或两个以上阶段进行抽样。

多阶段抽样的具体做法如下。先从总体中随机抽取若干大群,再从这几个大群内抽取几个小群,这样一步步抽下来,直到抽到最基本的抽样单位为止。比如要在某县抽取若干居民进行健康状况调查,可按照县—乡—村—居民的顺序,分为三个阶段进行抽样。第一阶段,从全县所有的乡中抽出若干个乡。第二阶段,从选取的若干个乡中抽出若干个村。第三阶段,从抽取的若干个村中抽出若干个居民。每一阶段都必须严格按照随机抽样的原则进行。这三个阶段中,前两个阶段是过渡性的,只有第三个阶段才能抽到调查单位。

多阶段抽样的主要优点在于:一是抽样前不需要总体各单位的完整名单,各阶段的名单数较少,抽样工作简单易行,适用于较大范围的、样本数量较多的抽样调查;二是抽出的样本相对集中,便于调查的组织和调查工作的展开;三是可以使抽样方法更加灵活和多样化,在抽样调查的各个阶段可以根据具体情况分别采用不同抽样方式。各阶段的抽样数目和比例,也可以根据实际情况来定。值得注意的是,务必在类别和个体之间保持平衡或者合适的比例。

2)非概率抽样(nonprobability sampling)

社会科学研究中有时候也会遇到无法选择概率样本的情况,这时候只有采用非概率抽样。非概率抽样是按主观意向进行的抽样,在这种情况下,组成总体的每个元素或单位被抽中的概率是不均等的,因此样本的代表性不能够得到保证,有发生倾向性偏差的风险。由于不能计算抽样误差,因此不能从概率意义上控制误差并以此来保证推断的准确性。但是,在一些情况下,严格的随机抽样几乎无法进行,例如调查对象的总体边界不清,无法制作抽样框,这时只能采用非概率抽样。

在市场调研中,非概率抽样因其便捷、经济、无需抽样框等优点经常被采用,它可以用于调查的设计开发、探索性研究、分析概率抽样调查结果等许多的方面。例如,在调查的设计开发过程中,调查目标的系统陈述、问卷设计、问卷测试、问卷调查、抽样设计等环节采用非概率抽样,能够便捷地收集被调查者的各种信息,有助于调研人员形成想法,拓展思路,得出结论。[4]

非概率抽样主要包括偶遇抽样、判断抽样、定额抽样和滚雪球抽样等。

(1)偶遇抽样(accidental sampling)。

偶遇抽样又称为方便抽样或者自然抽样,它是指研究者根据实际情况,以自己方便的形式选择那些恰当的地点、时间里出现的人作为样本。我们经常看到电视上的记者在街头或者公共场合拦住过往的行人作调查、取得资料的形式就是偶遇抽样的一种。这种方法具有相当的可行性,而且实施起来十分容易。但是这种方法有其自身的局限性,即样本的代表性较差。

偶遇抽样与随机抽样看似有些相似之处,以至于常常有人认为偶遇抽样就是随机抽样。但实际上,偶遇抽样不能保证每个元素都有相同的概率被抽中,而往往是那些研究者最先碰到并且最方便接触的人具有更大的选中机会。因此,偶遇抽样得到的研究结果在推广过程中应该十分谨慎。

(2)判断抽样(judgmental sampling)。

判断抽样又称立意抽样(purposive sampling),它是指研究者根据研究的目标和自己主观的分析来选择和确定研究对象的方法。用这种方法,必须要求研究者对他所研究的总体有充分的了解与判断力,否则,抽取的样本的代表性就会大打折扣。

通过判断抽样挑选样本的最常用的方法就是找“平均人”的方法,即找到总体中的典型,比如要了解中产阶级的生活方式,研究者可以找一些他们认为是典型的中产阶级的人员进行研究;想要了解大学生的消费情况,则可以找一些能够代表大学生消费水平的“平均”型学生来了解。

(3)定额抽样(quota sampling)。

定额抽样又称为配额抽样,它是指依据总体的一些特征或者某些控制指标,如年龄、性别、教育程度等,在总体中按分配比例抽取样本。配额抽样分为两个阶段:第一,分配配额,即将总体按照一定的特征或控制指标分类,在通常情况下,样本中这些特征的比例与他们在总体中的比例应该是相等的;第二,根据主观判断或者方便抽样,人为地抽取样本。比如,预测美国选民选举投票的前景,如果一个城市的共和党选民占60%,民主党选民占40%,假定要选取300名选民作为样本,则样本中共和党选民为180名,民主党的选民为120名。

(4)滚雪球抽样(snowball sampling)。

滚雪球抽样是一种特殊的抽样方法,当研究者无法了解总体的情况时,可以先从总体中的少数成员入手,对他们进行调查,通过他们了解到还有哪些是符合条件的人;再去寻找那些人,并且询问他们知道的人。这样,如同滚雪球一样,研究者就可以通过了解到的有限的人群,找到越来越多的具有相同性质的被调查人群。

滚雪球抽样的困难在于,有时碰到敏感性问题,会难以追踪下去,因为被调查的人群往往出现不合作的情况,这样就难以得到预期的样本数。因此在最初就要找到尽可能多的符合调查要求的人员。由于滚雪球抽样方法产生的样本的代表性不能确定,因此,这种方法通常适用于探索性研究。

3)PPS(probability proportion to size)抽样

在一些实际操作中,有时概率抽样很难使样本中的每一个元素都有同样被抽中的概率。例如,要从几百家北京的报纸中抽取20家进行调查,一个有1000多名员工的报社,与仅有30名员工的报社所占的地位是不同的。如果按照概率抽样的话,样本的代表性和精确度都很难保证。当总体各单元之间的差异非常大时,有必要考虑使用非概率随机抽样方法,即赋予各单元一个不同的入样概率,使大样本的入样概率大,小样本的入样概率小,从而提高评估量的评估精度。这种方法就叫做PPS抽样方法。

PPS抽样方法又称不等概率抽样法、概率比例抽样法、标准组群抽样法、按容量比例概率抽样法。其具体做法如下。在第一阶段,每个子群按照其所包含的元素数量,被分配大小不等的抽取概率。大的群比小的群拥有更大的概率。但在第二阶段,从每个群中抽取相同数量的元素。通过两个阶段的不等概率抽样,使得总体中的每一个元素被抽到的概率相同。用公式来表示PPS抽样原理,即为:

img37

二、研究步骤

抽样调查是由点代面的调查方法,为了保证达到以样本推断总体的目的,抽样调查对于程序的要求非常严格。在使用抽样调查进行研究时,需要遵循以下步骤。

1.界定总体

界定总体就是根据研究的需要,确定调查对象的范围,从而确定抽取样本的对象和依据样本作出推断的范围。倘若研究总体界定不当,即使采用严格的抽样方法,也会导致抽取的样本缺乏代表性。

1936年,美国的《文摘》杂志曾因为错误地界定总体而导致了一场失败的民意测验。在当年的总统大选之前,《文摘》杂志依据电话号码簿和车牌号编制了抽样框,再从这些号码中抽取出一部分样本,寄出了1000万张询问投票的明信片。然后,《文摘》杂志根据回收的200万份结果预测了共和党候选人兰登将以领先15%的得票率获胜。然而选举结果却令预测者们大跌眼镜,民主党候选人罗斯福才是最后的胜利者,且其得票率反超兰登20%。

《文摘》杂志预测大选结果失败的原因在于,他们依据电话号码簿和车牌号进行抽样,那些没有家庭电话和私人汽车的选民就被排除在调查范围之外。而1933年美国的经济大萧条导致一部分家庭没有能力安装电话和供养私人轿车,但这部分人又是选民的主力军之一,劳动阶层希望民主党人当选为总统。其结果就是《文摘》的预测南辕北辙。

要进行成功的抽样调查,必须了解和掌握总体的结构及各个方面的情况,样本必须取自明确界定后的总体,而依据该样本得到的调查结果也只能相应地推广到这种最初界定的总体范围中。

有效的总体界定方法,是先按照调查目的的要求定义一个理想总体,即目标总体。再根据实际情况对这种理想总体加以修正,形成调查总体。这样就能够明确地识别被排除的部分,使我们能够对推断的局限性作出估计。

2.编制抽样框

一般来说,样本是从抽样框中抽取出来的。要得到一个良好的抽样框也是不容易的。抽样框通常是不完全的,或者一部分是模糊不清、难以辨认的,或者含有未知的重复部分。比如,对于人口调查,制定完全准确的抽样单位一览表是不可能的,因为每天都有人出生和死亡;人们也可能更换住址,或者提供错误的住址和电话号码。特别是做较大规模的调查,因调查包含易变的总体,建立充分良好的抽样框是比较困难的,而且在时间和金钱上的花费都很大。较好的解决办法是理出家庭住址,以此为抽样框,从中抽取样本。因为家庭住址是比较固定的,这样的话就不容易发生遗漏等问题。

如对某一城市18岁以上的大学生进行抽样调查时,就需要该市全部18岁以上的大学生的名单,并进行统一编号,建立抽样框。当最新名单难以得到时,还应对现有名单进行检查和整理,才能使用。如果抽样分多个阶段、在几个不同城市的抽样层次上进行时,就需要建立多个相应的抽样框。在上述例子中,如对18岁以上的大学生进行多阶段抽样,需要从全市的所有大学中抽取10所大学,再从每所大学中抽取10个院系,最后从每个院系中抽取30名学生。这样,就需要分别收集全市所有大学的名单,每所大学中所有院系的名单,以及每个院系中所有学生的名单,形成三个不同层次的抽样框。

3.确定样本数和抽样方法

样本大小不仅影响它自身的代表性,还直接影响到调查的费用和人力成本。确定样本数,一般应该考虑三个因素:调查总体的规模大小、总体内部的差异程度和对调查结果的精确度的要求。一般来说,调查的总体规模越大,所需的样本数量就越多;总体内各单位的差异程度较大的,样本数量应该尽量多一些,反之,就可以少一些;对调查结果的可信度和精确度要求越大,则抽取的样本数量应越多。

统计学中通常认为,样本的数量要大于30个(也有专家认为至少要50个)。这是因为,当样本规模大于30时,无论总体的分布如何,其平均数的抽样分布将接近于正态分布。但在社会科学的研究中,样本规模至少不能少于100个。这是因为,在社会科学的研究中,研究者不仅仅需要以样本整体为单位来计算平均数、标准差、相关系数等统计量,还需要将样本中的个案按照不同的指标划分为不同的类别,进而分析不同类别之间的差异和不同变量之间的关系。

抽样方法可以分为随机抽样和非随机抽样。调查者可以根据研究的目的和要求,结合要研究的总体的具体情况,选取不同的抽样方法。比如,研究并非要将得到的结论推广至总体,而是为了调查变量之间的关系,则可以考虑用非随机抽样。再如,有时研究者受到来自委托方的时间压力,调查不可能经历太长的时间,调查也应该采用非随机抽样。

4.抽取样本

抽取样本时,应该严格按照所选定的抽样方法,从抽样框中抽取一个个抽样单位,构成样本。由于抽样框建立的先后和抽样方法的不同,有的抽样可以在实施调查之前就完成,但较多的抽样是在实施调查的过程中和调查同时进行。

比如,要在一个乡抽取100名60岁以上的老年人进行调查,由于乡村的人数不多,且名单统计较为齐全,则研究者可以先从总体中抽取100名老年人的名单。等其他准备工作做好了以后,按照事先抽取好的名单进行调查即可。但若是针对某省的60岁老年人进行调查,且调查的人数为2000人,则由于人员名单数量庞大,实际抽样也较为麻烦,则需要采用多阶段抽样的方法进行。

5.样本质量评估

抽样的目的是用样本来推断和评估总体的某些特征,所以样本的统计值能否很好地代表总体的参数值,是抽样的核心问题。样本质量评估,就是对样本的质量、代表性和误差等进行初步的检验和衡量,其目的在于防止因样本的偏差过大导致的失误。衡量样本质量的主要依据是系统偏差与抽样误差。

样本评估的基本方法是将可得到的反映总体中某些重要特征及其分布的资料与样本中的同类指标的资料进行对比。若二者之间的差别很小,则可认为样本的质量较高,代表性较强;否则,样本的质量和代表性就不够。例如,我们要在某大学做一次抽样调查,假设该校有20000名学生,我们需要从中选取400人的样本。首先,可以从该校获得一些数据,如各年级学生的比例,男女学生的比例等,然后看这400人中各相关比例是多少,如果与总体的比例接近,则说明样本的代表性较好,反之则说明代表性不够。

三、案例分析

为了达到理论联系实际的目的,这里举两个实际抽样的例子,案例一是对网络论坛的帖文进行研究时的抽样方案,案例二是对我国六城市居民上网行为进行调查时的抽样方案。前者适用于内容分析的前期抽样,后者适用于问卷调查的前期抽样。读者可根据实际调查的需要进行参照。

1.案例一:2006年下半年强国社区中日论坛帖文研究抽样调查方案[5]

关于中文网络论坛帖文的研究,大致有三种样本抽取方法:一是全部抽取,以一段短时间内论坛中若干讨论区的全部发帖作为研究样本;二是主观判断,根据某个讨论区总体大小和研究需要,设定样本量和抽取发帖;三是指数判断,利用论坛提供的统计数据(如帖子点击排行、十大热门话题榜等)选取研究样本。以上三种基本上都属于判断抽样,也是目前中文网络论坛研究中较为常用的非概率抽样方法。

如何对国内知名网络社区强国社区的中日论坛的帖文进行抽样呢?以下是对该论坛2006年下半年的帖子进行抽样调查时的步骤。

1)研究对象和抽样总体

研究对象是指2006年7月1日—2006年12月31日强国社区中日论坛内发布的所有帖子,包括主帖和回帖。为了简化操作和突出重点,研究者仅将相关论坛半年中发布的所有主帖作为抽样总体。以主帖的分布构建抽样框,而将跟随主帖的回帖看做主帖的一部分同时进行分析。这样就统一了抽取样本的特征且兼顾了样本信息的完整性。

2)抽样单元

对论坛信息做历时性的研究,抽样单元大小的选择以时间区隔单位作划分,可以是日、周、月或是年等各个级别。

研究者通过对中日论坛的观察和统计,论坛对话串主帖发布时间与其跟帖时间一般存在2天左右的差异,极个别讨论串有更大的时间跨度(回帖与主帖的发布时间间隔3天及以上)。研究者通过对中日论坛进行观察和统计,并参考了一些既有的研究成果,认为中日论坛的日常话题活跃期基本为一周,之后便被新的话题淹没。因此,研究者将“周”作为初级抽样单元。考虑到存在“月内周”和“跨月周”两种类型,其中“跨月周”包含了月初和月末,因此在抽样时对两种类型的“周”需要区分考虑。

3)抽样方案的选择

第一步采用分层抽样和简单随机抽样相结合的方法抽取星期。2006年7月1日—2006年12月31日期间,共有26周,其中22个月内周,4个跨越周。前者占所有周总数的85%,后者占15%。研究者基于研究经费和时间的限制,选取其中6周作为研究样本,按照月内周和跨月周各自所占的比例,在研究时抽取5个月内周和1个跨月周作为样本。抽样采用分层抽样的方法,即视月内周和跨月周为2个不同的层,分别建立月内周和跨月周抽样框。再采用简单随机抽样的方法,分别抽取5个月内周和1个跨月周。为了保证样本的分布平均,原则上在每个月抽取一个样本,遇到重复的月份则放弃。最后抽取的样本如下:

2006年7月2日—7月8日(月内周)

2006年7月30日—8月5日(跨月周)

2006年9月3日—9月9日(月内周)

2006年10月8日—10月14日(月内周)

2006年11月19日—11月25日(月内周)

2006年12月24日—12月30日(月内周)

第二步采用整群抽样,抽取选中时间段的所有主帖及其回帖,这些讨论串便是所需要的研究样本。

2.案例二:我国六城市居民上网行为抽样调查方案[6]

1)调查的总体和样本

调查选取我国6个城市所有18岁以上的居民(包括外来人口,但不包括因年龄太大等生理原因不能接受调查者)。

在每个城市选取500位居民,即6个城市共抽取3000位居民进行调查。

调查的分析单位为个人。

2)抽样程序

本次调查采取多阶段随机抽样的方法进行:首先,从每个城市的所有城区中抽取5个城区。其次,从每个抽中的城区中抽取2个社区,即每个城市共选取10个社区(或街道办事处)进行调查。再次,从每个被选中的社区(或街道办事处)中抽取2个居委会。这样,每个城市共抽取20个居委会。再次,从每个被抽取的居委会中抽取25户居民家庭。最后,从每个被抽中的家庭中抽取1个18岁以上的成员。

3)抽样的步骤与方法

第一阶段:从城市中抽取城区。

采用简单随机抽样的方法,列出全市所有城区的名单,进行从小到大的顺序编号,再用抽签法抽取其中5个城区。假设某市有8个城区,编号为1—8,将城区的名称和对应的编号分别写在小纸条上,将每张小纸条折叠,放入暗盒中混合,从中抽取5张小纸条,上面写的城区名称就是选取的样本城区。

第二阶段:从城区中抽取社区(或街道办事处)。

采用简单随机抽样的方法,列出每个城区中的全部社区(或街道办事处)的名单,进行从小到大的顺序编号,再用抽签法抽取其中2个社区(或街道办事处)。假设每个城区有10个社区(或街道办事处),编号为1—10,将社区(或街道办事处)的名称和对应的编号分别写在小纸条上,将每张小纸条折叠,放入暗盒中混合,从中抽取2张小纸条,上面写的社区(或街道办事处)名称就是选取的样本社区(或街道办事处)。

第三阶段:从社区(或街道办事处)中抽取居委会。

采用系统抽样的方法,先列出每个社区(或街道办事处)的全部居委会名单,按照从小到大的顺序编号,然后计算抽样间隔,即抽样间隔=居委会总数/2。假定某个社区(或街道办事处)有20个居委会,那么抽样间隔为10。然后将1—10号分别写在10张小纸条上,将每张小纸条折叠,放入暗盒中混合,随机抽取1张,假定抽取的号码为6,那么这个号码就是第一个抽中的居委会号码;第二个抽中的居委会号码为6+10=16。

第四阶段:从居委会中抽取居民。

获得该居委会中所有居民户的名单,将其顺序编号。然后计算抽样间隔,(考虑到实际调查中可能出现的拒访、搬迁、无人在家等实际情况,抽样的规模按照样本实际比例的2倍来抽,即每个居委会抽出50户居民家庭),抽样间隔=居民户总数/50。假定某居委会有336户居民,先将他们按照顺序编号,计算出抽样间隔为336/50=6.7,取整数为7;然后,将1—7分别写在7张小纸条上,将每张小纸条折叠,放入暗盒中混合,随机抽取1张,假定抽取的号码为3,则从第3户开始,每隔7户抽取一户。这样,最终可以抽取第3,10,17,24,…,325,332共47户居民,再加上第2户、第9户及第16户,共50户居民。

第五阶段:从居民中抽取被调查人。

从被选中的居民户中,随机抽取一名18岁以上的有上网行为的人作为调查对象。

四、问卷设计

问卷(questionnaire)是传播学实证研究收集资料的有效工具,它包括了一系列的问题与陈述。无论问卷是何种形式或用于何种目的,问卷设计必须配合研究,针对研究进行设计。

1.问卷的基本组成

问卷是调查研究中用来收集资料的主要工具,它的形式是一份预先精心设计好的,用来测量人们的行为、态度和特征的问题表格。研究者所需要了解和掌握的那些变量特征、各种测量指标,就是通过问卷中的问题反映出来的。问卷主要有两种类型:一种叫自填式问卷,即由调查员发给(或邮寄给)被调查者,由被调查者自己填写的问卷;另一种叫访问式问卷,即由调查员按照问卷内容向被调查者提问,并根据被调查者的回答来填写问卷。

一份完整的调查问卷通常包括问卷名、封面信、指导语、问题及答案、编码等几个部分,每一部分都有特定的内容。

1)问卷名

问卷名即问卷的标题,它是对调查主题的概括说明,以使被调查者能够一目了然地获悉可能要回答哪方面的问题。在确定标题时,要尽量做到简洁、醒目,最好能引起被调查者的兴趣。

2)封面信

封面信的基本作用是为了向被调查者说明与调查有关的活动背景和相关事项,以争取被调查者的理解和信任,赢得他们的支持和配合,又称卷首语(cover letter),一般置于问卷主体之前。被调查者是否接受调查并认真填写问卷,在很大程度上取决于封面信的质量。特别是用邮寄问卷的方式进行的调查研究,封面信的影响更为显著。封面信的语言应简明扼要,诚恳可信,篇幅不要太长,一般以两三百字为宜,以免影响被调查者阅读。一般来说,封面信应该交代如下内容,说明调查主办者的身份,说明调查的主要目的,说明调查的大致内容,说明调查对象的选取方法和意义,说明调查的保密措施并致谢。

3)指导语

为使被调查者在填写问卷时避免误解和出错,问卷中需要用指导语告知被调查者回答问题的方式和具体要求等。有些问卷的填答方法比较简单,指导语可以在封面信中用一两句话统一交代就可以了。比如,“请在合适的选项方框中打‘√’”;有些指导语则附在调查的具体问题之后,对填答要求、方式、方法、过程和范围等予以补充说明;有时为了便于被调查者更方便地了解填写规则,也可将指导语集中放在封面信之后,以“填表说明”的方式给予统一说明。

4)问题及答案

问题和答案是问卷的主体部分,也是问卷设计的主要内容和关键所在。根据调查者设计问题的不同方式,可分为开放式问题、封闭式问题和半封闭式问题。

开放式问题指在问卷上只提出问题,不列出答案,由调查对象自由回答的问题。开放式问题的长处是提问较为容易,对象的回答也较为真实,往往可以得到意想不到的材料;其弱点是一般只能作定性分析,难以作精确的定量分析。开放式问题通常适用于研究者不清楚研究结果或打算预测回答结果时,因此经常用于探索性、预备性的研究。

封闭式问题指不仅要提问,而且要列出可供选择的答案;限制回答的方式和数量,让被调查者选择所赞同的答案的问题。封闭式问题包含多种类型。①肯否式,列出的答案只有两个:正、误,或对、错。②多项选择式,也称菜单式,即每个问题后列出多项答案,让调查对象选择,选择的数量可以限制也可以不限制。③等级式,提出问题,让调查对象选择程度。根据表示程度的方式不同,又可以分为数字式、线段式和文字式。④定距式,所谓定距式,就是指选择答案不是一个点,而是一个区间。封闭式问题能够保证回答具有更高的一致性,并且比开放式问题更易于进行分析,所以应用更为普遍。但由于列出了答案,很容易使一个不知道如何回答或没有看法的回答者猜着回答,甚至随便乱答,且有可能忽略一些重要的答案。

半封闭式问题兼有封闭式问题与开放式问题的特点,也就是说既列出答案,又留有被调查者自由回答的余地。半封闭式问题有两种形式:一种是在选择答案中增加“其他”选择项。值得注意的是,如果调查对象经常填写“其他”这一栏,说明答案设定得不够合理,没有列出最主要的选项。另一种形式是在列出的答案后加上了解动机、理由类问题,以了解调查对象回答的原因与动机,弥补封闭式问卷的不足。

一张问卷可采用多种不同的问题类型。具体采用何种类型的问题主要根据调查对象的特点和研究问题而定。一般对象多采用一些封闭和半封闭的问题;但向相关问题的专家进行调查时,就不用过多地采用封闭式问题,因为专家可能会对封闭式问题所给出的答案不满意,从而拒绝回答或不能很好地合作。调查涉及的问题较多且简明扼要时,可采用封闭式问题;涉及的问题较为集中且要求详尽表述时,则可采取开放式问题。

5)编码及其他资料

为了将被调查者的回答转换成数字,以便输入计算机进行处理和统计分析,需要将回答结果进行编码。所谓编码(coding),就是赋予每一个问题及其答案一个数字作为它的代码,它有预编码和后编码两种类型。后编码(postcoding)是在调查问卷收集上来以后再进行的,预编码(precoding)则是在问卷设计的同时完成。实际调查中,研究者多采用预编码。编码一般放在问卷每一页的最右边。

问卷中除包含以上内容外,往往还包括另外一些相关资料,如问卷编号、访问日期、调查员及审核员姓名、被调查者的住址及联系方式、被调查者合作情况等。

2.问卷设计的基本步骤

问卷制作过程主要包括前期准备、设计问卷初稿、评估及试用、修改定稿四个基本步骤。

1)前期准备

开始设计问卷之前,首先应针对所研究的课题进行一定的探索性研究,了解课题的基本情况,确定研究假设。课题基本情况的了解可通过查阅文献资料,增加对课题的熟悉程度,找出前人的研究成果和不足;其次,可以通过个别访谈和开座谈会的形式,研究者围绕调查课题,与各种对象(一般是与研究课题相关的人)交谈,并注意观察他们的特征、行为、态度,了解样本的基本状况,从而避免问卷中的问题表达含糊不清,也有利于答案的设计。在此基础上,研究者可以确定问卷设计纲要,其中应该包括问题的形式、问卷的内容、自变量和因变量及一些具体的调查项目等。

2)设计问卷初稿

在前期准备工作的基础上,就可动手设计问卷初稿了,这一阶段主要是将抽象的研究课题转化为具体指标的过程。方法主要有两种,即卡片法和框图法。

卡片法的主要思路是从具体问题出发,然后到测量变量,再到研究假设。具体操作方法如下:第一步是根据探索研究得到的对于课题的印象,将具体的每一个问题写在一张卡片上;第二步是根据问题的内容,将具有相同内容的问题的卡片放在一起;第三步是将每一组问题卡片按照合适的询问顺序加以排列;第四步是排定各组的顺序,使卡片连成一个整体;第五步是根据被调查对象填答是否方便等因素,对问题的顺序加以调整,对不当之处加以修改,并将卡片上的问题按确定的顺序写在纸上,形成问卷初稿。

而框图法的思路正好相反,它先从研究假设开始,然后到测量变量,最后到具体问题。操作方法如下:第一步是根据研究假设和所需资料,在纸上画出问卷的各个部分及其前后顺序的框图;第二步是具体写出每部分中的问题与答案,安排好顺序;第三步是根据被调查对象填答是否方便等因素,对所有问题进行检查修改,从而产生问卷初稿。

在实际问卷设计中,一般将两种方法结合使用:先根据调查内容的结构,确定问卷的各个部分及其顺序;然后将各个部分的具体问题以卡片的形式加以编制;最后调整问题的顺序,形成问卷初稿。

3)评估及试用

问卷初稿不能直接用于正式调查,必须对问卷初稿进行试用和修改,这对于问卷设计至关重要。问卷初稿试用的具体方法有两种,一种是客观检验法,一种是主观评价法。客观检验法是选择一些典型样本进行试调查,通过对试调查结果的分析,对问卷进行修订。试调查样本一般为30人至50人。试调查是问卷设计的重要步骤,它有两个目的:一是考察问卷的信度、效度;二是进一步发现具体缺陷,如问题的难度、分量、顺序是否合适,问题的内容是否合理,语言的表述是否确切等,以便加以改正。主观评价法则是将问卷初稿分别送交该研究领域的专家、其他研究人员以及典型的被调查对象,请他们对问卷初稿进行阅读与分析,根据他们的经验来指出问卷的不妥之处。在问卷试用中,应将两种方法结合使用才能使问卷设计得更加完善。

4)修改定稿

根据上述方法找出问卷中存在的问题后,研究者应对问卷初稿中存在的问题进行认真分析与修改,最后定稿。这样,问卷就可以正式用于实地调查了。

3.问卷设计的原则

设计调查问题时,应该注意一些最基本的事项。

1)提的问题要紧扣研究主题,内容准确集中

问卷调查的目的决定了问卷调查的内容与形式,每一条款都应非常直接地对准一个具体的问题或论题。

2)避免使用术语和缩略语

研究者所提的问题应首先考虑被调查对象的阅读能力和理解能力,避免艰深的专业用语,应使用大众传播媒介常用的词汇。

3)避免含义不清的字眼

问卷用语应准确明了,防止模棱两可,引起歧义。

4)陈述简短

陈述要尽可能简洁,问题越长,回答的工作量就越大,由此可能引起的误差和偏差也就越大。

5)表达中立

问卷表达尽量使用中性词,避免带有偏见性、导向性和提示性的表述。

6)尽量不要涉及敏感性话题及个人隐私的问题

在西方国家,婚姻、年龄、收入都是敏感问题,一般都应避讳。

7)合理安排问题顺序

因为问题的顺序安排可能会导致问卷的顺序效应,即前面问题的存在改变了调查者对后面问题的回答模式。一般情况下,应将被调查者感兴趣、熟悉的、简单易答的问题放在前面,先问非敏感的问题,个人背景资料通常放在结尾,开放式问题放在最后。此外,要尽可能地使用结构式的问答题,即将内容上相互有联系的问题放在一起,以保持被调查者的注意力及思路顺畅。无结构的项目条款通常容易导致大量低质量数据产生。

8)对可能的答案进行仔细的分类

有效的分类系统必须满足三条原则:①穷尽的;②互斥的;③类间的差异大于类内的差异。类别设定既不太宽,又不太窄;既不太多,又不太少。

4.问卷投放

问卷调查的质量不仅取决于问卷的设计,也取决于问卷从发放到回收各个环节的工作。问卷发放时必须关注两个问题:一是要有利于提高问卷的填答质量,二是要有利于提高问卷的回收率。

在社会科学的研究中,问卷调查的方式有多种,主要分为两种类型:一是自填式问卷法,二是结构式访问法。

自填式问卷法(self-administered questionnaire)是指调查者将调查问卷发送给(或者邮寄给)被调查者,由被调查者自己阅读和填答,然后再由调查者收回的方法。结构式访问法(structured interview)则是指调查者依据结构式的调查问卷,向被调查者逐一提出问题,并根据被调查者的回答在问卷上选择合适的答案的方法。

其中,自填式问卷法分为个别发送法、集中填答法和邮寄填答法三种;而结构式访问法又分为当面访问法与电话访问法两种。

1)自填式问卷法

自填式问卷法的优点是成本较低,可以节省时间、经费和人力;具有较高的匿名性,对于敏感性问题、涉及个人隐私问题的调查最适合采用自填式问卷法。同时,自填式问卷法能够避免人为因素的影响。这是由于自填式问卷法采用统一的设计和问题排序、选项表达,能够在一定程度上排除调查人员给回答者带来的影响。

但是自填式问卷法的问卷回收率较低。这是由于它完全是依赖于被调查者的态度是否合作来决定的。不过,依靠某些调查组织或机构来进行自填式问卷调查,给予被调查者一定的物质或精神报偿,能够保证较高的问卷回收率。其次,这种调查方法要求被调查者拥有一定的文字阅读能力和理解能力。此外,调查资料的质量往往得不到保证。这是因为采用自填式问卷时,被调查者常常是在没有调查人员在场的情况下填答,会出现错答、缺答、乱答的情况。

自填式问卷法包括以下几种类别。

(1)个别发送法。

个别发送法是自填式问卷法中最常用的一种。它的操作步骤是研究者将印制好的问卷交给调查员,调查员们依据事先抽取好的样本,将问卷逐个发放到被调查者手中,讲清楚调查的意义和要求,标明重点注意事项,请被调查者填答,并约定时间、地点收取。[7]例如,对某城市的大学生的择业倾向进行调查,可以派调查员到学生宿舍发放问卷给被选为样本的大学生们,请他们当场填答后回收问卷,也可以请他们在两天内将问卷填好,上交给所在班班长,再由班长统一回收后交给调查员。

个别发送法的优点是比较节省时间、经费和人力;调查员当面对被调查者解释调查的目的和说明问卷中的提问项,能够保证填答的有效性和问卷的回收率。但它存在的不足是调查范围受到一定的限制,毕竟调查员的数量、时间和精力有限。但综合其优点与不足,个别发送法在所有问卷投放方法中是资料收集效果最好的,因此该方法被广泛应用于多项社会科学的调查中。

(2)集中填答法。

集中填答法是指通过某种形式将被调查者集中起来,每人发放一份问卷;接着由研究者统一讲解调查的主要目的、要求、问卷的填答方法等事项,然后请被调查者当场作答,统一回收问卷的方法。收回问卷的方式可以采用投入问卷回收箱的办法,以消除集中填答所带来的某些心理顾虑。

集中填答法要比个别发送法的成本低,并且能够保证问卷的回收率和填答质量,能够在某个时间段内收回大量的问卷。[8]但是这种方法的使用范围有限,一般适合对于学生,以及单位配合下的问卷调查,并且在填写过程中,被调查者容易受到“团体压力”的影响,不利于客观表达自己的看法。

(3)邮寄问卷法。

邮寄问卷法也是收集资料的基本方法,它的具体做法是:调查者把印制好的问卷封好,像邮递信件一样通过邮局寄给被调查者,被调查者填完后再将问卷寄回调查机构或调查者。除了寄送问卷外,随邮件还要附上一封说明信和贴好邮票的回邮信封,信封上写好回邮地址和收信人(或收信单位),以方便被调查者将填答好的问卷顺利寄回。

邮寄问卷法能够不受空间的距离限制,调查范围较大。同时,它还特别省时、省力、省钱。可以说,邮寄问卷法是问卷调查方法中最便宜、最方便、代价最小的方法。

但是,邮寄问卷法的实施存在很多障碍,真正实施后,实际效果往往也很差。它有两个突出的缺陷:一是很难找到一份现成的和完整的总体成员的姓名、地址及邮政编码名单,这导致邮寄调查的样本往往无法抽取,问卷也不知道寄给谁;二是问卷的回收率难以保证,这是邮寄问卷法的一个致命弱点。有许多的主、客观因素会导致被调查者放弃问卷调查的工作,比如嫌麻烦,觉得无聊,认为与自己无关,没有时间,遗忘等,这些都会阻碍调查问卷寄回调查者手中。正因如此,调查研究较少采用邮寄问卷法。

下面是美国社会学家所进行的一项邮寄调查的回收情况(见表8-2),通过表格可以看出,没有跟踪催促的,回收率仅为46.2%,而通过发跟踪信提醒或催促的,总的回收率达到77.3%。

表8-2 某次邮寄调查的问卷回收统计[9]

img38

如何提高邮寄问卷法调查的回收率和资料的质量,需要调查者在实际调查中加以探索。但有些事项必须注意,比如强调调查者身份的正式性、非营利性,它会使被调查者确信调查的合法性和价值,从而起到使被调查者愿意填答并寄回问卷的作用;封面信语气要委婉,增加被调查者合作的可能性;还可以用跟踪信或提醒电话帮助提高回收率。

2)结构式访问法

结构式访问法又称标准化访问法,它是指访问员根据结构化、标准化的问卷提问,把被调查对象的回答填写在问卷上。结构式访问法的优点是能够对调查过程加以控制,获得很高的回答率,适合任何被调查对象。但它的缺点是成本很高,需要调查者逐个访问被调查者,耗时长且花费较大。此外,结构式访问法对于比较敏感的问题或涉及个人隐私的问题不太适合。

结构式访问法包括以下几种类型。

(1)当面访问法。

当面访问法是一种以口头语言为中介,调查员与被调查者面对面进行交往和互动的过程。其基本操作方法是:研究者先选择和培训调查员,然后由这些调查员严格按照问卷提出的问题、问题的顺序、问题与选项的具体要求对被调查者进行访谈,并严格按照调查方案的规定亲自记录调查对象的回答。

当面访问是调查员与调查对象以口头语言为中介进行面对面交往互动的过程,这种交往互动贯穿整个资料收集过程之中,调查员阐述问题的语气,解释疑惑的程度,以及调查员的动作、表情、衣着、年龄等个人因素,调查对象对不同调查员提出问题理解的差异、对调查员的主观印象等,都会影响资料收集的质量或客观性,因而这种方式对调查员的访谈技巧、应变能力的要求就比较高。

当面访问法独有的调查特点,使它具有调查回答率高、调查资料的质量较好以及调查对象的适用范围广这三个优点。一方面,由于当面访问法是调查员与被调查者面对面的访谈,因而被调查者拒绝合作或者半途而废的情况比较少见,所以调查的成功率较高。另一方面,由于调查员在场,能够对被调查者进行观察,且能够控制被调查者回答问题的质量,因而调查的真实性和准确性大大提高,收集到的资料质量较好。

但是,调查员与被调查者之间的互动有时会影响到调查的结果,导致回答的偏差。且由于当面访问法的匿名性较差,会影响到被调查者回答问题的态度以及提供的答案的真实性。同时,调查费用高、历时长,也是对该类型调查的一种挑战。

(2)电话访问法。

电话访问法是指调查员通过打电话的方式与被调查者联系,并在对话中对被调查者进行调查访问的方法。

电话访问法的操作步骤是:由经过挑选和培训的调查员依照一定的方法抽取电话号码,然后逐一拨打,在电话中根据访谈问卷的内容进行访问,同时记录调查对象的回答,这些记录将被转换成数据进行分析。

电话访问法是在电话普及率高,个人对私人空间比较注意保护的情况下采用的收集资料的方法,是发达国家比较流行的一种调查方法。它的最大优点是简便易行、成本较低,尤其适合比较简单的问卷调查,例如民意测验,并且具有很好的匿名性,不会产生心理压力。但是通过电话访问的拒访率较高,经常会出现电话无人接听或是被调查者没有时间配合调查的情况,同时电话访问对被调查者的选取难以具备很强的代表性,都是在有电话者中间选取被调查者的,并且此项调查不宜进行太长时间,一般以10分钟左右较为合适。因此它不太适合学术性、研究性调查。

当计算机逐渐普及后,电话访问法又与计算机结合使用,发展成为计算机辅助电话访问,即“计算机辅助电话访问系统”(computer assisted telephone interview system,简称CATIS)。计算机辅助电话访问的最典型工作方式是:调查员坐在计算机前,面对计算机屏幕上显示的问卷向被调查者提出问题(这些被调查者都是由电脑以随机的方式进行拨号抽中的),并将被调查者的回答直接录入计算机;研究人员在主机上监控和管理所有调查员的访问进展,及时解决各种特殊问题。当电话访问结束后,所有被调查对象的数据都已经录入计算机,在机器汇总后可以直接用SPSS软件进行统计分析。

这种电话访问法的主要优点是十分迅速,不但通过电话访问能够快速地找到被调查者并进行调查,而且收集得到的数据能够直接进入计算机,采用SPSS软件进行分析。此外,调查中也便于对调查员进行监督和控制,使得调查质量比当面访问更容易得到保证。

以上介绍的自填式问卷法和结构式访问法各有利弊,分别适用于不同的调查课题和调查对象。从总体来看,当面访问法自然是最好的调查方法,其次是电话访问法、集中填答法和个别发送法,最差的是邮寄问卷法。电话访问法适合简单的问卷调查;个别发送法和邮寄问卷法最好有一定的组织机构作为背景,集中填答法对于面向学生的调查比较有效。各种方法的大致比较如表8-3所示。

表8-3 某次邮寄调查的问卷回收统计[10]

img39

根据统计,报刊投递问卷的回收率为10%~20%;邮寄问卷的回收率为30%~60%;发送问卷的回收率为80%~90%;访问问卷的回收率可达100%。问卷的回收率是影响问卷质量的一个关键因素,回收率过低会影响调查的结果。根据有关专家研究测定,成功的问卷回收率应达到70%以上,而50%的回收率是送发问卷调查的最低要求,如果回收率不到50%,那么该问卷调查已失败,此调查就应终止。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈