抽样误差和偏差

时间：2023-06-20 百科知识版权反馈

【摘要】：三、抽样误差和偏差抽样技术再好，也不能保证样本完全代表总体，也就是说，统计值不可能完全和参数值相等，只是在样本量足够大的情况下两者很接近。研究者无法控制的因抽样机遇而产生的误差，属于抽样误差。配额抽样的缺陷主要是，额度分配难以精确代表各集合之间的实际比例，特别是当前的动态信息难以及时收集。总的说来，非概率抽样方法较之概率抽样法可靠性要差，然而比较容易应用，耗费也较小。

三、抽样误差和偏差

抽样技术再好，也不能保证样本完全代表总体，也就是说，统计值不可能完全和参数值相等，只是在样本量足够大的情况下两者很接近。研究者无法控制的因抽样机遇而产生的误差，属于抽样误差（sampling error）。至于抽样偏差（sampling bias），它并非是由于抽样机遇的原因导致的随机误差，而是研究者的失误造成的系统误差。美国1936年总统竞选预测说明这种情况。前述Literary Digest未能预测到罗斯福将当选总统，所设计的调查样本数很大，有1000万，然而样本选择出了偏差。Literary Digest根据汽车注册和电话簿名单抽样，1936年正值经济萧条，有相当数量的选民并没有自购汽车或安装电话，这部分人口的投票状态被忽视了，这是抽样偏差。

抽样偏差主要来自非概率抽样技术。由于研究人员怕费时和花钱，往往主观随意抽样。管理研究中也有采用主观抽样的情况，尽管有偏差，但使用简便。主观抽样的方式有以下三种：

1.简便抽样

研究者将自己所能遇到的人员、事件作为样本，如“街头拦人”作为调查对象，这在电视节目上常常看到。到企业参观，向所遇到的职工提问了解情况，这都属于简便抽样（convenience sampling）。这种抽样调查可提供信息，但很难据此得出一般适用的结论。譬如，研究人员想弄清这样一个问题，银行营业所工作人员如果每上班1小时后休息5分钟是否能减少差错，便在就近找了两个营业所比较，一个安排短暂休息，一个连续工作，一个月以后，短暂休息的营业所差错减少，那末，是否能得出结论，短暂休息对减少营业所人员操作差错有好处？并不能。因为此样本并非从总体中选择出来，对该营业所有效，并没有足够理由推广到其他营业所。

2.判断抽样

判断抽样（judgment sampling）是研究者根据自己的知识结构和研究目的而主观断定样本的过程。这种方法在探索性研究初期很适合，在未完全辨识清楚研究对象的总体构成前就可进行研究，发现问题。比如，研究企业亏损原因，可以主观挑选有代表性的企业进行研究，研究结果有助于发现亏损原因，但不能得出普遍亏损原因的结论。有的企业采取本企业员工试用新产品的办法，判断新产品的市场前景。如员工通不过的产品，预计在市场上也不可能成功，这也是判断抽样法的应用。

主观判断实际上背后隐含着某种准则，例如，可根据历史记录来判断抽样。美国总统选举预测往往把几个州作为样本，注意力集中在人口不算多的几个州的预选，原因是这几个州的预选结果历来与最后选举结果接近。也可根据问题的重要性来判断，500个国有大型工业企业的产值占全国国有企业总产值的绝大部分，从这500家企业中选择样本推断国有企业总产值具有充分理由。然而，主观判断抽样总是存在以偏概全的可能。

3.配额抽样

配额抽样（quota sampling）是按计划给各类分总体分配样本数。盖洛普民意测验1936年预测成功和1948年预测失败都是采用配额抽样。配额抽样先要辨识与研究有关的总体多种属性，如企业职工先按工作类别分类，再按年龄、受教育程度等属性分类。这样可分出大学教育以上、男性的工程技术人员等类的最基本集合，然后按算术平均或加权方式对各基本集合分配样本额度。

配额抽样的缺陷主要是，额度分配难以精确代表各集合之间的实际比例，特别是当前的动态信息难以及时收集。1948年，盖洛普错误地预测杜鲁门将落选，其原因就是样本额度分配不当。再者，样本是主观判定的，是否在本集合中有代表性也有疑问。

总的说来，非概率抽样方法较之概率抽样法可靠性要差，然而比较容易应用，耗费也较小。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈