选择被访者

时间：2023-02-28 理论教育版权反馈

【摘要】：选择被访者要仔细选择被访者，因为他们是调查数据的来源。选择被访者的第一步是定义你想要研究的总体。区区几十个访员不可能与这个目标群体中的所有人员进行访问，即使他们有无限的时间和资金。绝大多数调查采用95%的置信度，也就是说，不管通过何种方式计算，在5%的误差下100个被访者中都会有95个得出和访问总体所得相同的结果。样本量取决于总体大小和允许误差的范围。

选择被访者_访谈的艺术

选择被访者

要仔细选择被访者，因为他们是调查数据的来源。假如你与错误的人在错误的时间和地点进行了调查访问，那么再好的问题设计也没用。

（旁注）提问顺序是提问策略的有效补充。

定义总体

选择受访者的第一步是确认你所希望研究的总体或目标群体。

选择被访者的第一步是定义你想要研究的总体。这个总体可能规模很小且同质化，如教堂里的一个年轻人社团中的成员；也可能规模很大，具有多样性，如全中国所有具有选民资格的成年人。你可能只对一个大规模总体中的某个子集感兴趣，比如年轻人社团中的男孩子，或者北京地区的女大学生。你确定的总体应该包括全体有能力且够资格回答问题的人以及你想要由之推出结论的人。

假如目标总体规模很小（比如有氧健身班学员或者电视台的技术人员），你就可以和全部人员进行访问。但是，绝大部分调查要研究的总体远远超出调查时间、资金和人员允许的范围，比如总体是一个大学里35 000个大学生或者一个250 000人口的城市里所有年满18岁的居民。区区几十个访员不可能与这个目标群体中的所有人员进行访问，即使他们有无限的时间和资金。

既然与目标总体的所有人员进行访问往往是不可能实现的，那就只访问其中的部分人员并且把结论推广到总体，要努力使这个抽样群能真正代表总体。

抽样原则

抽样最根本的原则是，样本必须能够代表总体或研究目标群体。市场上卖西瓜的人仔细地从一个西瓜上切下一小块所实践的就是这一原则，这一小块楔形西瓜展示了整个西瓜是什么样的。

（旁注）总体就是所有目标调查对象的集合。

每一个定义总体里的潜在被访者都必须有均等的机会被抽到，你必须确定每个人被抽到的可能性，它取决于允许误差幅度。调查的精度就是“用同样的方法得出的样本结果和总体结果之间的相似水平”⑨。绝大多数调查采用95%的置信度，也就是说，不管通过何种方式计算，在5%的误差下100个被访者中都会有95个得出和访问总体所得相同的结果。NBC—美联社、CBS—纽约时报、ABC—华盛顿邮报或者哈里斯（Harris）定期发布的调查成果规定，调查的允许误差是4%，这意味着，假如42%的被访者同意总统的工作方式，那实际的数字可能像38%那么低或者46%那么高。

（旁注）样本是一个缩小了的总体。

（旁注）误差决定了调查的价值。

允许误差取决于如何使用调查结果，假如你想预测选举结果或者一个新药的疗效，就应尽量把误差控制得更小些，控制在3%或者更小一点。假如你进行调查是想知道员工们对新娱乐设施的感觉，那可以让误差稍高点，控制在4%或5%。

样本量取决于总体大小和允许误差的范围。没有所谓的神奇公式来决定被访者数量。一些调查机构使用大约1 500个样本就可以实施误差控制在3%的精确性全国调查。标准公式显示，总体数量增加时，最小样本数量占总体的比例下降很快。换句话说，为了获得同样精确的结果，你对5 000人的访问比例要远远大于对50 000人的访问比例。公式还显示，要把误差从5%降到4%再降到3%，你必须增加很多样本。为了减少这一点误差也许不值得提高那么多费用来增加大量访问。菲利普·梅耶（Philip Meyer）提供了下面的表格，来展示在一个5%的误差范围下，95%的置信度水平上，不同总体所必需的样本量⑩。

（旁注）样本量即访问对象的真实数字。

总体数　　　　　　　　样本数

无限384

500 000 　　　　　　　384

100 000 　　　　　　　383

50 000 　　　　　　　 381

10 000 　　　　　　　 370

5 000 　　　　　　　　357

3 000 　　　　　　　　341

2 000 　　　　　　　　322

1 000 　　　　　　　　278

抽样技术

样本量大小很重要，但是，对于调查的有效性来说，如何实施抽样更重要。

随机抽样

随机抽样是从目标总体中抽取有代表性样本的最简单方法。例如，假如你有总体人员的全部名册，你就可以把所有的名字放在一个容器内，把它们混合在一起，然后一次抓取一个名字直到取够样本。这就像发行彩票，藏有数字的乒乓球在密闭的玻璃容器中滚动，然后一次一个球地蹦出来，这就是一个随机抽样。

（旁注）随机抽样就好像“从帽子里抽人名”。

随机数字表

一种较复杂的随机抽样方法是，给每一个潜在的被访者编号，然后建立或购买一个随机数字表，闭上眼睛，用手指随便点一个数字，然后读出它上、下、左、右或对角线上的相邻数字。把这个数字代表的被访者作为一个样本，或者取这个数字（假设它为46）的后一个数字6，和它右边相邻数字（假设为29）的前一个数字2，把两个数字合起来作为被访者的编号62。重复这个过程直到取够样本。

等距抽样或随机数位抽样

你在电话簿中每隔10个抽取一个电话号码，在顾客花名册里每隔五个抽取一人，或者选择在超市里每隔一个碰到的人，这都是在应用等距抽样或叫随机数位抽样。这种常用的抽样技术有一些内在缺陷，例如，可能有15%或更多的人的电话号码没有列在电话簿上，一些群体（学生、穷人、民工、正在搬家的人）可能没有电话或者名字没有列入电话簿。一个投票人、顾客或成员名单可能不是最新的，或者已根据专业、资历、阶层或成员类别进行过划分，这样产生的样本就无法代表总体。一天中的什么时间、一周内的哪一天、商场所在位置、商场内的哪个铺位都可能决定在那儿购物的是某类特定人群:家庭主妇、职业人士、自由职业者、失业者、退休者、夜班工人或者青少年学生。

（旁注）等距抽样是指，你从名单表中每隔n个选择一个名字。

分层随机抽样

随机抽样可能无法提供总体中全部有代表性的子群体，即使是放在帽子里抽签。如果总体里的各子群体可以清楚定义（如男性和女性；年龄；教育水平；收入水平；不同文化团体），那就可以使用分层抽样。这一方法允许你按照每一群体在目标总体中所占比例分别从中抽出最小样本。例如，假如你知道目标总体中包括52%的女性和48%的男性、12%的青少年和9%的老年人、75%的职业人士和25%的无职业者，调查样本就要反映出这些比例。

（旁注）分层抽样最能代表总体。

抽样点

一些调查机构给访员提供抽样点，每一个抽样点代表一个含特定类型人群（如CBD或退休人员）的地理区域（如一个街区或一公里之内）。给访员的指令可能会要求他跳过街拐角的房子（街拐角的房子通常更贵），然后每隔一个房子选取一户，直到他们得到两个男性和两个女性作为被访者。这种抽样点或街区抽样使调查设计者不必借助人员名单、随机数位或电话号码就可以控制对访问对象的选取。点或街区要仔细选择以代表总体内的不同单元。美国农业部曾经通过对农场和农作物进行航拍来确定要作为访问对象的农场主，以此来推断每年不同农作物的种植数量和可能产量。

（旁注）一个抽样点通常是一个地理区域。

自发性回应抽样

精度最低的抽样方法是自发性回应抽样。你几乎每天都能看到这种方法，它们充斥于电视的脱口秀节目、新闻报道以及关于一些药品、保健品功效的宣传报告中。你猜，谁最可能打电话给报社、电台、电视台或者给有关部门写信？答案是:那些正处于极度气愤情绪中的人，或者对某一行为持极端反对或赞同态度的人。态度平和的人很少打电话或写信。这就很容易预测，关于节目好坏、交通管制、流产、死刑、药物疗效等问题的自发性回应调查会得出什么结果。自发性回应样本不具备随机性和对总体各单元的代表性。

（旁注）自发性回应抽样是抽样方法中最没有代表性的一种。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈