首页 理论教育 研究对象的选取

研究对象的选取

时间:2022-03-03 理论教育 版权反馈
【摘要】:如第一节中所述,研究对象的选取是研究设计的重要内容,它关系到研究结果的科学性和可推广性。因此,能够对研究对象进行深入的分析与研究。同时,在对一些特殊的总体进行研究时,如意外伤害儿童,非概率抽样的方法比概率抽样更有效。在抽样设计中,研究对象的总量、地理分布、个体的同质性等诸多因素将会影响抽样方法的选取。研究者应该充分考虑,使研究的对象和抽样的方法达到最佳的搭配。

如第一节中所述,研究对象的选取是研究设计的重要内容,它关系到研究结果的科学性和可推广性。本节拟讨论抽样的步骤、方法、量(大小)及误差控制等问题。

一、抽样的意义和特点

任何心理与教育研究都有其特定的研究对象,而根据某些特定原则来加以选择的特定研究对象的总和,称为总体(或母群)(population)。研究者面临如何选择研究对象的问题,即抽样(sampling)问题。通常而言,在心理与教育的实际研究工作中,研究者不可能也没有必要对人群中的所有个体进行研究,而必须根据一定的原则,从总体中抽取一些有代表性的个体,就叫样本sample),以此样本来进行研究,然后根据对样本研究的结果去推论总体的有关情况。

在心理与教育的研究中,抽样有非常重要的意义,具体表现为:

1.加强研究效能 抽样是以少数有代表性的样本来代表总体,减少研究中被试的数量,从而节省人力和物力,缩短研究的时间,达到更加经济有效的目的。

2.减少研究误差 抽样的方法能够减少非抽样误差,保证研究结果的准确性。随着被试数量的增加,研究的实施将变得更加复杂和困难,在人员培训、资料收集、数据分析中的误差会急剧增加。而通过抽样,则可减少研究过程中的这些误差。

3.深究研究对象 抽样的方法使研究者有更多选择研究方法的自由。通过抽样,研究者可以广泛使用访谈法、观察法和实验法,而不仅仅限于调查法。因此,能够对研究对象进行深入的分析与研究。

4.确保研究施行 在实际研究中,一些研究对象可能因为某些原因而无法获得,采用抽样的方法能够保证研究的顺利进行。

研究者通常可采用非概率抽样和概率抽样两种方法从总体中抽取样本。在非概率抽样(或非机率抽样)(non-probability sampling)中,每个样本被抽中的概率是未知的,取决于研究者的个人判断以及实施是否方便。由于非概率抽样不能保证样本的代表性,因此,不能运用推论统计的方法来推论总体。在探索性的研究中,非概率抽样常常用来获取一些基本的信息,为建立初步的研究假设服务。同时,在对一些特殊的总体进行研究时,如意外伤害儿童,非概率抽样的方法比概率抽样更有效。常用的非概率抽样的方法有方便抽样、判断抽样、配额抽样和滚雪球抽样等(注5-3)。

注5-3:方便抽样(convenience sampling)是指在这种抽样方法中,只需随手抓取符合条件的例子,持续这个过程直到收集到的样本达到原先设定的大小为止。判断抽样(judgment sampling)是根据研究人员的需要或方便,依其主观的判断有意抽取研究所需的样本。配额抽样(quota sampling)是研究者或取样者遵照某种既定的标准来取样,如职业、年龄等。滚雪球抽样snowball sampling)是先访问具有代表性的某人,然后再由被访者推荐,访问第二人。如此继续进行,像滚雪球一样,逐渐增加受访者人数,从而达到研究要求。

概率抽样(或机率抽样)(probability sampling)是指按照随机化的原则抽取样本。它可以保证样本的代表性,使样本和总体保持相同的结构。因此,以概率抽样为基础的研究结果,可以作进一步的推论。

下面我们将主要介绍概率抽样的基本步骤、抽样方法、抽样误差及控制等问题。

二、抽样的基本步骤

抽样步骤通常包括界定总体、确定样本容量、选择抽样方法、实施抽样等环节。

1.界定总体 总体的界定是抽样设计的基础。只有规定了明确而有意义的总体,才有可能保证样本的代表性。总体的界定主要取决于研究者的研究目的,目的不同,选取的研究总体也不同。其次,总体的界定要兼顾研究的外部效度和可行性,结合研究的目的,在两者间寻求一个恰当的平衡。如研究高校学生的心理健康状况时,研究的总体自然是高校的学生。为了使研究结果具有普遍的意义,研究的总体应该是全国所有高校的本科生、专科生和研究生。但这样就会导致研究需要大量的样本,使取样工作的难度加大,数据收集和处理也变得更加复杂。如果只取北京市高校的本科生为总体,则虽然保证了研究的可行性,但却降低了研究的外部效度与价值,使研究结果的概括性受到一定程度的影响。若能依据一定标准将全国分为几个区,以特定地区的高校为总体,再进一步在该特定区内抽样,则可在一定程度上解决外部效度与可行性的矛盾。

2.确定样本容量 样本容量(或样本大小)(sample size)指所选取的样本数量。从样本代表性的角度来说,样本容量越大,代表性越好。但是随着样本容量的增加,每一样本对样本代表性的贡献越来越小,而研究所需的人力、物力和时间却持续增加,同时研究中的非抽样误差(注5-4)也将增大。一般说来,研究者总是在一定的误差允许范围内,选取最小数量的样本,关于具体样本容量的确定,将在后面“样本容量的确定”部分再讨论。

注5-4:非抽样误差(non-sampling error)指不是由于样本代表性不够所导致的误差。

3.选择抽样方法并抽取样本 抽样的方法有很多,每种方法都有各自的特点和适用的条件。在选择抽样的方法时,一般要考虑两个因素:(1)保证抽样的代表性,使抽样误差降至最小;(2)考虑研究的可行性,尽量选择经济、可行的抽样方法。在抽样设计中,研究对象的总量、地理分布、个体的同质性等诸多因素将会影响抽样方法的选取。研究者应该充分考虑,使研究的对象和抽样的方法达到最佳的搭配。

三、具体抽样方法

抽样方法(sampling method)是指探讨如何从总体中抽取具有代表性样本的方法,或探讨在何种情形下宜采用何种抽样方法。抽样的方法很多,选取何种抽样,一方面取决于研究的目的和研究条件的要求,另一方面取决于抽样方法的具体特点和适用范围。下面介绍几种主要的抽样方法。

(一)简单随机抽样

简单随机抽样(simple random sampling)是以随机原则为依据的最基本的抽样方法。它是指根据随机原则,在总体中直接抽取若干个个体作为样本。在随机取样中,总体中每一个个体被抽取的概率是均等的,而且个体之间是彼此独立的。

常用的随机抽样方法有两种:一是抽签法;二是随机数字表抽样法。抽签法(drawing straw)指将总体中的所有单元都编上号,写在签上,每一次抽一个签,直到抽足所需要的样本量为止。随机数字表抽样法(或乱数表抽样法)(table of random numbers sampling)同样将每个单元编上号,以随机数字表为基础,目前还可采用计算机上的随机数字功能进行抽样。

简单随机抽样是众多抽样方法中最简单、最容易操作的方法,并且可以借助计算机来进行。它适用于样本总体个数有限,并且数量不大的情况。但是,简单随机抽样也有一些缺点:(1)当总体数量较大时,将每个个体进行编号就显得费力、费时,特别是当总体的清单不可能获得时,就不能使用简单随机抽样的方法;(2)当总体中各个子群体间的差异较大时,使用简单随机抽样的方法,会导致较大的抽样误差;(3)如果总体在地理位置上分布较广泛,简单随机抽样就会导致样本太分散,而使研究的实施变得困难;(4)如果总体中具有某种特点的子群体所含单元较少,但对于研究来说却非常重要时,简单随机抽样的方法也不适用。

(二)系统抽样

系统抽样(systematic sampling)是简单随机抽样方法的一种改进,它是指按一定的间隔顺序,在总体中抽取样本,主要包括三个步骤:(1)将总体中每一个个体按一定标准排列并编号;(2)确定抽样间隔,即用总体的个数除以样本个数,如从2000个样本中抽取100个样本,则抽样间隔为20;(3)采用抽签法或随机数字表选择一个抽样的起点,然后按照抽样间隔依次往下选取样本。需要说明的是,抽样起点的数值必须不大于抽样间隔的数值。

系统抽样特别适合大样本,其主要优点是能在总体范围内进行抽样,使抽取到的样本比较分散,从而保证了样本的代表性。但是,当总体的排列顺序与抽样间隔具有对应的周期性特点时,系统抽样会导致严重的抽样误差。如在入室调查中,假设某栋楼的中间为两居室,两边为三居室(如图5-2)e如果按四户为抽样间隔,就会只抽到三居室或只抽到两居室的居民。事实上,三居室和两居室的居民可能会在收入、资历等方面具有不同的特点,这样就会导致抽样误差。

(三)分层随机抽样

分层随机抽样(stratified random sampling)是指按某些特征,先将总体分成K个互不重叠的子总体(或K层),然后从每个子总体中独立地

图5-2 系统抽样的误差

如果以“编号1”的住户为抽样起点,按照四户为间隔,将只能抽到三居室的住户,即加黑的住户。

抽取子样本。在对总体进行分层时,应该使各层内部的差异最小,而使各层间的差异最大,这样才能保证分层的意义。同时,分层要保证每个个体都能够、并且只能够归属于一个层,而不能有所遗漏或重叠。因此,在选择分层标准和分层的过程中,应该充分考虑研究对象的特点,否则不但不能降低抽样误差,反而会增大抽样误差。为此,在抽样前,应当计算每层的数量与在总体中的比例,按下列公式进行抽样:

式中ni为第i层中抽取的样本数量,n为样本总量,Ni为第i层的对象数量,N为总体数量。

分层抽样适用于总体成分复杂,各成分间差异较大的情况。在这种情况下,分层抽样是比简单随机抽样更精确的抽样方法,合适的分层抽样能有效降低抽样误差。同时,分层抽样允许研究人员对抽样进行更多的控制,以自己的研究意图来确定每一层大约需要多少人。但是,分层随机抽样要求对总体中各层的情况有较多的了解,否则就难以进行科学分析。同时,为了保证各子总体的样本能够进行有意义的统计,要求样本量更大。

(四)整群抽样

整群抽样(或丛集抽样)(cluster sampling)是指将总体划分成许多组或层,按照随机原则在组或层(整群)中抽样,抽中的整群全体成员均为样本。如在教学实验中,要求以班级为单位,不能打乱原有的教学班,因此,就可以采用整群抽样法,在学校中随机选取一个班为实验班。

分层随机抽样要保证各层间的异质性,而整群抽样要保证各层间的同质性。同时,整群抽样的对象是群,即组或层只有一个或多个群被抽取,且被抽取到的群的全体成员均为样本;而分层随机抽样的对象是群内的个体,即每个群内的成员都有一部分被抽取到。

整群抽样适用于总体范围大、数量多的情况。它的主要优点是抽样方法简单,同时,对于抽取到的样本可以进行集中处理,使研究实施更加节省人力、物力和时间。但是,整群抽样相对来说是一种较为粗糙的抽样方法,抽样误差较大。同时,如果各层间的同质性太低,则整群抽样的方法不适用。

(五)多阶段抽样

多阶段抽样(multistage sampling)是前面几种方法的综合,其基本特点是将整个抽样过程分成几个阶段,在每个阶段采用不同的抽样方法。通常在第一阶段,将总体进行分组,构成初级抽样单位,用简单随机抽样或其他方法从总体中选取一定数量的组;第二阶段,在每个抽中的组内,再按照一定的标准将组分成多个子群体,作为第二级抽样单位。以此类推,抽取各级子总体。然后从各级子总体中选取所需要的样本。如在全国儿童心理健康状况的调查中,首先,根据地理位置将全国分成几个大地区。然后在每个地区内选取一个省或直辖市。再将省或直辖市分成各个市,选取一定的市,如此,再到县、乡、镇、学校和班,最后从班中选取样本。

多阶段抽样避免了简单随机抽样需要一个总体清单,以及抽取的样本过于分散的缺点。同时也解决了整群抽样误差太大的缺点。在总体数量多、分布广的情况下,能够解决分层抽样一次分层的局限。同时,多阶段抽样简便易行,经费节约,在研究总体范围大、单位多的复杂情况下非常有用。但是,多阶段抽样的设计相对较为复杂,需要对研究对象有更多的了解。在对总体进行多层次分层时,如果不能选择有效的标准,将会导致更大的抽样误差。

四、样本容量的确定

样本容量即从全部研究对象中抽取的、可供实际观测的样本对象的数量大小。一项研究所需要的样本究竟要多大才最为合适?这是每个研究者都要面临的问题。如果样本数量太少,则样本的代表性就小。但是,样本增加到一定规模后,减少抽样误差的作用就不再显著,而收集资料所需的金钱和时间等资源会大大增加,资料的分析也比较困难。因此,在研究设计中,如何合理地确定样本容量的大小,就成了研究过程中必须解决的问题。样本的容量主要受以下因素的影响:

1.研究目的 如研究者要制定一个测验的常模时,就应选择广泛、大量的样本。

2.研究经费和时间的限制 在研究中应该考虑研究经费和时间对研究的限制,选择合适的样本容量。

3.研究问题的特点 在一项研究中,如果有较多的因素无法控制,则应该选择较大的样本容量,通过随机化的方法来控制这些因素。

4.研究所采用的抽样方法 每种抽样方法所带来的抽样误差是不同的。为了减少抽样误差,一个重要的方法就是扩大样本容量。因此,为了保证抽样的代表性,各种抽样所需要的样本容量是不同的。

5.研究对象总体的同质性 一般说来,总体的同质性越小,所需的样本容量就越大。

6.研究实施过程中的具体情况 如在追踪研究中,被试流失的情况非常明显。在邮寄调查中,回收率通常较低。这些都需要在开始时选择较大的样本容量。

7.研究所使用的测量工具的可靠性 在同种条件下,测量工具越可靠,研究所需要的样本容量就越小。

8.研究所用的统计方法 各种统计方法为了保证其意义,都对样本容量有特殊的要求。如在使用因素分析对结果进行统计分析时,一般要求样本容量为题目数的2~5倍。

9.研究对结果精确程度的要求 一般来说,研究对结果精确程度的要求越高,研究所需的样本容量就越大。

在进行心理与教育研究的设计时,我们应当注意综合考虑上述各种因素,确定适合一项具体研究的样本容量。

五、抽样误差及控制

抽样误差(sampling error)是指样本统计值与总体相应参数之间的差异,即所抽样本不能真正具有代表性而产生的误差。我们知道,抽样的目的是要以从样本中获得的资料为基础,来解释和说明总体的特征。但是,由于研究对象的总体不可能是绝对同质的,因此,要用样本的特征来代替总体的特征,就不可避免地会产生抽样误差。为了保证研究结果的准确性和可推论性,必须采取有效的方法来控制和减少抽样误差。

(一)抽样误差的计算

在研究过程中,由于所采用的抽样方法不同,其带来的抽样误差也就不同。但是,无论采取什么样的抽样方法,都必须保证一个基本的原则,即随机化的原则。因此,计算抽样误差的思路也大同小异。下面我们以简单随机抽样为例,简单介绍抽样误差的计算思路。

要估计抽样误差,需将样本统计量与总体参数进行比较。但是,当总体的个数很大或是无限时,总体的参数常常未知。根据统计学原理,样本统计量和总体参数存在如下关系:在正态分布的总体中随机抽取容量为n的无限个样本,样本平均数的平均数等于总体的平均数,样本平均数的标准误与总体的标准差成正比,与样本容量的平方根成反比。用公式表示为:

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈