首页 理论教育 偏倚类型及控制方法

偏倚类型及控制方法

时间:2022-05-09 理论教育 版权反馈
【摘要】:选择性偏倚可分为以下8种类型。如遗传性疾病的研究中,未到外显年龄的研究对象被分到健康对照组,常会出现偏倚,所以对遗传性疾病的研究就应该特别注意外显年龄这一个因素,控制方法主要是把不到外显年龄的对象排除在研究对象之外。如曾有研究认为口服雌激素与子宫内膜癌的发生密切相关,但进一步证明,使用雌激素可以刺激子宫内膜癌在早期较多的被检出。由于资料的收集方法、测量仪器、研究对

二、偏倚类型及控制方法

(一)偏倚的类型

偏倚按其在研究过程中出现阶段的不同,主要归纳为3种:选择性偏倚、信息性偏倚和混杂性偏倚。

1.选择性偏倚(selection bias) 在研究的初始阶段易出现选择性偏倚。造成选择性偏倚的主要原因首先是在设计阶段选择研究对象时,被选入的研究对象同未入选的对象间在与研究有关的特征方面存在着系统差别;其次是研究对象不正确的分为实验组和对照组,两组之间不同均衡、没有可比性。除此之外,选择性偏倚还可发生在资料收集阶段的失访或无应答等。选择性偏倚可分为以下8种类型。

(1)入院率偏倚(admisson rate bias) 指利用医院就诊或住院病人作为研究对象时,由于入院率不同而导致的偏倚。不同疾病的病人在不同医院的就诊或住院率是不同的,如病人疾病的严重程度、人们对某种疾病危害程度的认识水平、病人就医的条件、人群对某一疾病危害的了解程度、病人的经济条件、不同医院的专科特长以及对医院的信任度等因素。

当利用医院住院病人作为研究组和对照组时,由于病例只是该医院或某些医院的特定病例,所以形成研究组的病例不是病人总体的一个随机样本;又由于对照组是医院的某一部分人,而不是全体目标人群中的一个随机样本。因此,就同一病因学调查课题,在社会人群和医院中间时做调查,其结论是否相同,取决于病例组和对照组到医院就诊或住院的住院率。

因为研究者无法控制不同疾病的入院率,更难以保证不同疾病有相同的入院率,如果入院率不同,则易发生系统误差。因而单纯用医院病例来做研究难以排除入院率偏倚。一般要求同时设社会人群的外对照组或多选择几种不同疾病的内对照组来研究分析,以保证结果的可靠性

(2)无应答偏倚(nonrespondent bais) 无应答者包括研究设计中应予调查但因各种原因拒绝回答问题的人和失访的人两种类型。在临床研究中,无应答者可能由于对疾病的认识不同,或涉及个人隐私而对治疗效果和治疗反应不作回答。无应答是否造成偏倚,取决于无应答者在疾病暴露等方面的特征与应答者是否有区别。如果差异显著,则产生无应答偏倚。如研究采用邮寄问卷的形式,调查呼吸科出院病人的吸烟情况,一个月后总结收集的调查表发现,不吸烟者有85%回卷了问卷,而吸烟者仅67%回复了问卷。无应答的另一种表现形式是治疗过程中或调查中,研究对象未能按计划进行,中途退出研究,也称失访。失访的原因主要有效果不佳、副作用过大、工作调动、搬迁等。

要避免无应答偏倚出现,应保证足够的应答率,应答率=实际调查人数/应调查人数。一般达到90%以上,如低于70%,则偏倚较大。如某一组的应答率特别低应作专项分析,查明原因。

(3)排除偏倚(exclusive bias) 设计时应规定排除标准,即哪些被试者不能进入研究。当没有按照事先规定的标准从实验组或对照组中排除某些研究对象,从而造成处理因素与疾病之间的联系被错误估计,称为排除偏倚。如在一项阿司匹林与心肌梗死关系的研究中,实验组与对照组均不应包括患慢性关节炎者,也不应包括慢性胃溃疡病人,因为前者倾向于服用此药,而后者不倾向于服用此药。若患这两种疾病的病人在两组分布不均匀,导致对阿司匹林与心肌梗死关系的错误统计。

(4)健康工人效应偏倚(healthy worker effect bias) 由于个体之间存在差异,暴露于同一危险因素后不同个体的易感性不同,高易感的个体又有主动避免继续暴露的倾向,而低易感者则可能不在意暴露。由此可能会造成实验组的成员与整体情况存在差别,特别是在健康情况上有明显的差异,产生了健康工人效应偏倚。如曾有人做过一系列研究,了解体力劳动者与心血管并发症的关系。得出的初步结论是:参加一定的体力劳动(如冬季铲除门前积雪)将减少心血管疾病严重病发症的发生。后经过分析发现,出现这种差别是因为参加铲雪的成员本身具有较好的健康情况,与研究的总体情况存在着差异。

(5)志愿者偏倚(volunteer bias) 在有志愿者参加的研究中,经常会出现选择性偏倚,这是因为志愿者参加研究的群体同非志愿的群体可能会在文化水平、健康、饮食、吸烟、饮酒、锻炼等方面存在差异,造成入选对象与未选入的对象之间存在着系统误差。如在预防黑色素瘤发生的观察研究中,实施某项措施的效果(避免阳光晒伤),参加者都是志愿者,而将非志愿者作为对照,以此比较该项措施的结果,显然难以得出正确的结论。

(6)时间效应偏倚(time effect bias) 许多慢性疾病,在接触有效暴露至出现临床症状之前会有一段很长的潜伏期,因为没有明显的症状,或发生了早期病变而缺乏检测手段未检出,所以在研究时常被错误的归入健康对照组,由此造成的偏倚称为时间效应偏倚。如遗传性疾病的研究中,未到外显年龄的研究对象被分到健康对照组,常会出现偏倚,所以对遗传性疾病的研究就应该特别注意外显年龄这一个因素,控制方法主要是把不到外显年龄的对象排除在研究对象之外。总而言之,在研究中使用敏感的疾病早期检查技术,或开展观察期长的纵向研究,可能会控制时间效应偏倚。

(7)检出症候偏倚(detection signal bias) 有一些临床症状或体征,本身不是某种疾病的致病因素或危险因素,但人们可能因具有这种症候而去就诊,因而提高了早期病例的检出率,同时还可能得出该症状与该疾病存在关系的错误结论,导致出现检出症候偏倚。如曾有研究认为口服雌激素与子宫内膜癌的发生密切相关,但进一步证明,使用雌激素可以刺激子宫内膜癌在早期较多的被检出。相反,那些不服雌激素的子宫内膜癌患者,因为没有子宫出血的症状而不去医院就诊,因而早期被检出的比例相对较低,由此得出的口服雌激素与子宫内膜癌的发生密切相关的结论是不够严谨的。

(8)现患病例—新发病例偏倚(prevalence-incidence bias) 在临床研究中,病例对照研究的对象主要是现患病例,而队列研究中还包括新发病例。由于时间的因素,两种研究方法中的病例所提供的暴露情况在详细程度、真实程度上会存在着差异,由此造成的两种研究方法对同一研究可能会得出不一致的结论,产生现患病例—新发病例偏倚。

2.信息性偏倚(information bias) 主要发生在研究实施阶段。由于资料的收集方法、测量仪器、研究对象、研究者本身等方面造成的比较组间有系统的差别或不一致,由此造成的系统误差称为信息偏倚。本类偏倚主要包括以下6种常见的类型。

(1)回忆偏倚(recalling bias) 指两组研究对象在回忆过去发生的事件或既往史时,由于记忆失真或不完整,其准确性、可靠性存在着系统误差所产生的偏倚。回忆偏倚常发生于病例对照研究中。在病例对照研究中要回忆对危险因素的暴露情况,从被调查者本身来看,由于时间过长,回忆不准确,常产生较大偏倚。另外,病例组和对照组之间也可能存在着差异,如病例组可能对某些因素或影响因素有一定的了解,而有利于促进他们的回忆,而对照组未患此病,不了解这些因素,回忆也不够积极,因此两组之间在回忆时就可能产生偏倚。

(2)报告偏倚(reporting bias) 也称说谎偏倚,是研究对象有意夸大或缩小某些信息而导致的偏倚,有别于回忆偏倚。报告偏倚一种情况常见于敏感问题或隐私问题的调查。例如,调查中学生吸烟史、大学生的性行为,有相关一部分人会有意掩盖阳性行为。另一种情况见于某些研究对象为达到个人目的而有意说谎。如他们可能会继续从事某种职业而有意缩小某些患病信息。相反,涉及劳保、福利问题时,他们会夸大患病信息。

(3)诊断怀疑偏倚(diagnostic suspicion bias) 指研究者事先已知研究对象的某些暴露情况,怀疑研究对象已患病,或以一种主观偏见或愿望在诊断过程中去搜索某种阳性结果,使研究结果出现偏倚,称为诊断怀疑偏倚。这类偏倚常发生在前瞻性研究中。例如,在一项口服避孕药与下肢血栓性静脉炎关系的队列研究中,研究者对口服避孕药妇女,表现为仔细询问,认真查体,相对频繁地寻求静脉炎的依据,对那些可疑者,尤其是那些病情较轻,需较复杂准确的检查才能确诊的病例,则会采取进一步的诊断检查,最终使更多的病例被发现。相反,对未服避孕药的妇女,有可能较马虎的检查,最终导致结果偏倚。

(4)测量偏倚(detection bias) 是指对研究指标或数据进行观察或测量时产生的偏倚。可表现在仪器、设备、试剂等不符合要求,调查表设计缺乏科学性、记录不完整,调查人员的工作态度不认真、工作方式不合适等所造成的错误信息。

(5)归类错误偏倚(misclassification bias) 或称错分偏倚。如测量仪器本身的灵敏度和特异度很难达到100%,在这种情况下,就会产生一定的假阳性和假阴性病例,并导致错误的分组,进而出现归类错误偏倚。另外,混杂因素也可以导致归类错误偏倚。

(6)诱导偏倚(inducement bias) 由于研究者的询问技术不正确,或为获得阳性结论,诱导研究对象做某一种倾向性的回答而出现的差异,称作诱导偏倚。诱导偏倚常常表现为对病例组做诱导而对对照组不做诱导或负诱导,由此只能产生虚假结论。

3.混杂性偏倚(confounding bias) 混杂性偏倚主要出现在结果分析阶段。在评价研究的暴露因素与疾病之间的关系时,受到一种或多种既与疾病有密切关系,又与暴露因素有密切联系的潜在因素影响,从而部分或全部地歪曲了所研究因素与疾病的真实联系,这些影响称为混杂偏倚。这些潜在因素成为混杂因素。混杂因素见于多病因的病因学研究或多因素所致同一结局的研究中。

混杂因素的基本特点:①混杂因素必须是所研究疾病的独立危险因素;②混杂因素与所研究的暴露因素有关,但不是暴露因素作用的结果;③混杂因素与所研究的疾病有因果关系或通过其他因素同疾病产生因果联系,但不是暴露因素与疾病因果链中的一个中间变量。混杂因素只有在比较的两组间分布不均,而且只有在影响结果的情况下才能起混杂作用,产生混杂性偏倚。如在妇女使用月经棉与中毒性休克综合征的研究中,因为年轻妇女的月经量丰富,她们比中年妇女更喜欢高吸收度的月经棉,而高吸收度的月经棉比一般的月经棉更易导致中毒性休克综合征。因此,年龄和暴露于月经棉与发生中毒性休克综合征均存在着统计学上的关系,年龄是混杂因素。因此,混杂是对因果关系的混淆,在混杂偏倚分析中,首先要识别一个潜在危险因素是不是混杂因素,而后是如何控制的问题。

(二)偏倚的控制方法

偏倚可以发生在研究过程中的各个阶段,而且具有一定的方向性,不能相互抵消,也不能通过重复抽样或扩大样本含量加以纠正,只有通过科学而周密的设计、正确选择被试和测量方法、准确地分析结果,才有可能控制和减少偏倚。在每个阶段控制偏倚的常用方法如下。

1.设计阶段

(1)选择设计方案 在研究设计阶段,偏倚可源于研究对象的选取方面,如抽样方法不正确、纳入标准和排除标准不统一或模棱两可;样本的含量估计有误;实验组和对照组间缺乏对照;还可来源于调查方法和资料收集方法,如调查表设计不合理、缺乏客观指标等。如果是发生在设计阶段的偏倚,很难在其他阶段加以弥补,唯一的方法就是通过严格的设计来加以控制。如在病例对照研究中,以社区人群中的全体病例和非该病病例及正常人作为对照虽然非常理想,但往往难以做到。选用医院的病人虽然方便但易产生入院率偏倚。此时,在设计上应考虑选用两个或两个以上的对照组,如不同病种对照或对照组之一选自社区,这样通过不同对照组之间的比较就可以分析是否偏倚。

(2)随机化(randomization) 应用随机化的方法可以使研究对象有均等的机会被分配到各处理组中,同时也保证了各种干扰因素随机被分配到各处理组中。这些干扰因素既包括可知的和可测量的,还包括那些未知的和无法测量的。因此,按随机化的原则分配研究对象是较理想的控制选择性偏倚的方法。

(3)匹配(matching) 是指在研究设计中选择与实验组每一成员除处理因素外完全相同的研究对象作为对照组,以控制无关因素的干扰。匹配分为成组匹配和个人匹配两种形式。成组匹配,又称频数匹配,是指为一组研究对象配上一个潜在复杂因素频数相似的对照组;而个体匹配是指为每个研究对象根据需要控制的混杂因素配上一个或多个对照。匹配在实验性研究和非实验性研究中均可应用,一般来说,匹配条件越多,寻找对照就越困难。在实际的研究中,做到完全的匹配是很困难的,匹配的变量应当一致到什么程度应取决于实际的研究需要和现实的可能性,以防止过度匹配,增加研究的难度和费用。

(4)限制(restriction) 限制是指对各比较组研究对象的入选条件加以限制。虽然我们希望实验组和对照组在进行比较时,除了处理因素外的其他因素均应均衡,但实际在临床研究中往往很难做到。补救的办法就是针对某些可能的混杂因素,在设计研究对象的入选条件时加以限制。如研究吸烟与冠心病的关系时,年龄就可能是潜在的混杂因素,研究者就可限制研究对象在40~50岁之间,从而从某种程度上控制偏倚。限制也有局限性,主要表现在限制混乱因素的同时,一方面可能会造成研究对象对总体的代表性下降,使研究结果推论到一般人群的外推真实性受限;另一方面可能会无法分析混杂因素与研究因素的交互作用,难以观察到研究因素对研究对象的影响。因此,在采用限制策略时,最好只针对特别重要的混杂因素,先决条件是限制后仍然保证样本的代表性。

2.实施阶段

(1)标准化(standardization) 在收集资料和实施测量阶段,对研究者、实施者、研究工具及研究对象等相关因素都要实施标准化控制,以降低由此带来的信息性偏倚。如对实施者要进行统一的培训、统一标准、统一检测方法;对研究对象也要作统一的必要解释,使其能密切配合,如实、客观地提供信息;对研究中使用的仪器、设备应事先标定标准化,以保证测量的数据符合客观实际。

(2)盲法(blind method) 是避免研究者和研究对象发生偏倚的最有效方法,也是消除信息性偏倚的有效手段。盲法分为单盲法、双盲法和三盲法。①单盲法:只有研究者知道研究对象的分组情况,接受的是什么处理,而研究对象本人不知道。这种方法保留了非盲法的优点,避免了来自研究对象的偏倚,但仍未能避免来自研究者的偏倚;②双盲法:实验者与被试者均不知道实验分组及相关情况,只有研究设计者或其他指定的人员知道。优点是可以避免来自实验者与被试者这两方面的偏倚,如,诊断怀疑偏倚、报告偏倚等,但此操作起来比较复杂,设计要周密。如进行药物观察,就要制成大小、形状、颜色、甚至味道相同的安慰剂;③三盲法:被试者、实验者及研究者均不知道实验的分组情况,只有研究者委托的人员掌握着密码编号,直到统计学分析结束时。此法与双盲法比较,优点是可以避免研究者在统计分析结果时可能出现的偏倚,使结果与分析结论更加客观。

3.结果分析阶段

(1)分层分析(stratification analysis) 分层分析是一种常用的检出和控制混杂性偏倚的重要方法,它是指将研究资料按照某些影响因素分成若干层后进行分析。每层内实验组和对照组的无关变量均匀分布,减少了可疑的混杂因素,能避免结论歪曲。如在对乳腺癌患者身心健康情况进行分析时,年龄就是一个混杂因素,只有按年龄进行分层分析才能反映不同年龄阶段身心健康状况的真实情况,否则就会出现与实际情况不符的结论。

(2)多因素分析法(multifactorial analysis) 分层分析常需要足够的样本数量。当样本含量不足以进行分层分析时,就需要借助其他的方法分析混杂因素的影响,如多因素分析法。在多因素分析时,研究因素和每个混杂因素都被放到同等地位作分析,常用的多因素分析方法有多元协方差分析、Logistic多元回归分析、对数线性模型等。

(牛美兰)

模拟训练

一、单项选择题

1.研究体重与血压关系的研究,下列哪个因素为自变量        (  )

A.血压          B.体重

C.年龄          D.性别

2.研究体重与血压关系的研究,其中依变量是            (  )

A.年龄          B.性别

C.血压          D.体重

3.研究骨折后运动对功能的恢复,可选用              (  )

A.自身对照        B.组间对照

C.组内对照        D.前后对照

4.研究子宫脱垂与产后劳动的关系,自变量为            (  )

A.产后劳动        B.子宫脱垂

C.营养          D.工作

5.研究吸烟与肺癌的关系,自变量为                (  )

A.吸烟          B.肺癌

C.吸烟量         D.吸烟年限

6.研究吸烟与肺癌的关系,依变量为                (  )

A.吸烟          B.吸烟年限

C.吸烟量         D.肺癌

7.科研目的是                          (  )

A.外变量         B.依变量

C.自变量         D.控制变量

8.能够影响科研目的,不受结果影响的变量是            (  )

A.外变量         B.依变量

C.自变量         D.控制变量

9.前瞻性研究又称为                       (  )

A.质性研究        B.量性研究

C.预期性研究       D.实验性研究

10.在研究教学方法与学习成绩的关系中,下列哪个因素为外变量   (  )

A.教学方法        B.学习成绩

C.开始新教学法的时间   D.学生的智商

11.实验性研究和非实验性研究的分类依据是            (  )

A.研究目的        B.研究性质

C.研究对象        D.研究设计内容

12.在研究子宫脱垂与产后参加劳动的关系中,属于依(因)变量的是 (  )

A.劳动强度        B.产妇年龄

C.子宫脱垂        D.产后参加劳动

13.下列属于非实验性研究的特点是                (  )

A.设对照组        B.随机分组

C.随机抽样        D.没有人为施加因素

14.下列有关依(因)变量的正确的描述是             (  )

A.干扰研究结果的因素   B.研究想要观察的结果因素

C.导致研究结果产生的因素 D.受结果影响的因素

15.通过观察指标获得数字资料的方法属于             (  )

A.人种学研究       B.质性研究

C.量性研究        D.现象学研究

16.运用临床现有的资料如病历进行分析和总结的研究,称为     (  )

A.回顾性研究       B.前瞻性研究

C.试验性研究       D.预期性研究

17.在研究设计中选择样本时要注意                (  )

A.样本的数量尽量要少   B.样本的数量尽量要多

C.样本可随意抽取     D.样本的代表性要强

18.随自变量改变的影响而改变的因素为              (  )

A.外变量         B.依变量

C.干扰变量        D.控制变量

19.量性研究和质性研究是按下列哪项来分类的           (  )

A.研究设计内容      B.研究性质

C.研究目的        D.研究对象

20.类试验性研究必须具备的内容是                (  )

A.随机分组        B.随机取样

C.干预          D.设对照组

21.某医院护理部拟从该院内、外、妇、儿病房中随机抽取出100份已完成的护理病历进行分析,以发现病历书写中的问题,为更好地完善护理病历的书写提供依据。此种科研设计的类型为 (  )

A.前瞻性研究       B.实验性研究

C.类实验性研究      D.回顾性研究

二、多项选择题

1.研究子宫脱垂与产后劳动的关系,哪些是外变量          (  )

A.子宫脱垂        B.有无便秘

C.生产次数        D.产后几天下地

E.是否顺产

2.研究体重与血压关系的研究,哪些是外变量            (  )

A.测血压者        B.体重计

C.血压计         D.年龄

E.体重

3.研究吸烟与肺癌关系的研究,哪些是外变量            (  )

A.吸烟年限        B.吸烟量

C.肺癌          D.饮食习惯

E.吸烟

4.科研设计的主要内容                      (  )

A.确定研究对象      B.设对照组

C.随机分组        D.确定观察指标

E.确认变量

5.科研设计因设计内容的不同可分为哪几种类型           (  )

A.实验性研究       B.类实验性研究

C.非实验性研究      D.量性研究

E.质性研究

6.科研设计按研究性质可分为哪几种类型              (  )

A.实验性研究       B.类实验性研究

C.非实验性研究      D.量性研究

E.质性研究

7.实验性研究的优点有                      (  )

A.能准确解释因果关系   B.在护理问题的研究中应用广

C.反映研究的科学性较高  D.反映研究的客观性较高

E.不涉及伦理或隐私等问题

8.类实验性研究的优点是                     (  )

A.在护理问题的研究中比较实用  B.能准确地解释因果关系

C.研究结果可说明一定问题    D.反映研究的科学性高

E.不涉及伦理及隐私问题

9.类实验性研究与实验性研究相比较,不一定具备的内容是      (  )

A.干预             B.随机分组

C.设对照组           D.观察

E.访谈

10.实验性研究的设计必须具备的内容是               (  )

A.干预             B.完全自然状态

C.随机分组           D.随机取样

E.设对照组

三、填空题

1.实验性研究设计必须具备的三项内容为________、________和随机分组。

2.在研究工作中变量可分为自变量、________、________。

3.外变量是指某些能干扰________的因素。

4.设对照组的目的是排除与研究无关的干扰因素的影响,使结果具有________。

5.科研设计因设计内容的不同可分为________、________、________。

四、名词解释

1.变量 2.自变量 3.依变量 4.外变量 5.质性研究 6.量性研究 7.回顾性研究 8.前瞻性研究 9.非实验性研究

五、简答题

1.研究设计中选择样本的注意事项。

2.科研设计的主要内容有哪些?

3.量性研究的基本概念是什么?

六、应用题

请简述自变量和依变量的概念,并指出下列题目中的自变量和依变量及提出相关的四个主要外变量。“研究子宫脱垂与产后参加劳动的关系”。

(李秋芳)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈