首页 理论教育 评价的关键

评价的关键

时间:2022-03-01 理论教育 版权反馈
【摘要】:如果相关的文章出现在一个抽象的杂志,如循证护理,那么你对你的研究方法的质量就有一定的信心。评价的问题是非常明确的,并明确规定了人口、干预措施和成果。但是,评价可能受到没有发表的研究的影响而产生偏倚。包括在诺里斯评价里主要研究方法的质量是很高的。当个人的研究结果进行审查,但只有一项研究成果,有利于治疗组。统计测试系统的异质性评估结果之间的差异的研究,不能归咎于偶然。

在本节中,我们用目前普遍接受的标准来评价系统评价的质量(表12-1)。

临床案例:你是一个在初级保健或公众卫生保健系统工作的护士。该系统的目的是应用联合方案,以改善当地社区的健康。众所周知,患2型糖尿病的患者正在增加,高体重能增加患糖尿病的风险。护理组考虑了一些可能的干预措施。而你提出了糖尿病前期的活动和饮食干预方案。糖尿病前期的定义是糖耐量受损或空腹血糖受损,但没有达到糖尿病的水平。您的护理组很感兴趣,他们问你这种方案的有效性有什么证据。

(一)寻找证据

假如问题已明确提出,寻找证据会更有效。PICO的制定(患者或人口、干预、比较、结果)可以帮助我们制定一项非常具体的问题(理查森等,1995)。对于这种案例,您确定患者是成人前期糖尿病(糖耐量受损IGT或空腹血糖受损IFG,但不是糖尿病)。干预组:膳食干预和(或)体力活动的干预;对照组:常见的健康照顾。结果:体重减轻和维持。

现在,临床的问题非常清楚,你开始搜索。大家都知道用4S等级方法寻找当前的最佳证据。首先在金字塔的最顶端,如入门和指导方针,接下来的是概要,然后是合成,而最后是单一的研究。4S等级方法建议,为寻找最有效、最好的证据,你必须在系统水平的最顶端开始。这个级别包括临床实践指南。如果你没有成功,你去到下一步的概要级别,那些概要是文章已预先使用质量评价过滤过的以证据为基础的摘要。如果相关的文章出现在一个抽象的杂志,如循证护理,那么你对你的研究方法的质量就有一定的信心。但如果您仍然不成功,你去到合成级别(如科克伦图书馆),并最终单一研究。对于前期糖尿病病人减肥这个问题,您搜寻国家准则信息中心(http://www.guideline.gov),利用减肥和糖尿病前期这个词条就得到6个提示。一个相关的指南告诉你,有个随机实验得出的证据给出了以下建议:患糖尿病高风险的个体必须意识到适度减重和定时参加规律运动的好处;糖耐量受损患者应给予减肥和增加体力活动有关方面的指导(美国糖尿病协会,2005)。这是有用的,但现在你想知道特定的干预措施是否可用于减轻体重和增加体力运动。你去到下一个层次,使用减肥和糖尿病前期搜索循证护理。你只找到一个结果,一个诺里斯和同事(2005)的评价摘要,其中指出饮食、身体活动或行为会诱导或维持前期糖尿病成人的体重减轻(综述:非药物干预诱导或维持糖尿病前期成人减重,2005)。

这正是您正在寻找的专题。这是一个医学评价,你知道这些比期刊上刊登的系统评价质量要高(Jadad等,1998)。你决定去科克伦图书馆阅读全文评价(诺里斯等人,2005)。但是,你怎么知道它确实是一个很好的评价呢?表12-1可以评价方法的质量并解释结果,将结果应用于实践。

表12-1 系统评价文章的标准评价指南(采用自Ciliska等.2005)

(二)评价标准

1.结果是否有效

(1)评价是否揭示了一个明智的问题?我们首先要确定这个评价回答了哪些问题。作者有无明确确定人数、干预措施的类型和有利的成果?在诺里斯和同事(2005)的评价中,他们明确指出,总的目标是评估饮食、身体活动和行为干预在成人糖尿病前期关于减肥或控制体重的效果。评价的问题是非常明确的,并明确规定了人口、干预措施和成果。读者需要问问自己是否希望在所有的病人群体、干预措施类型和成果方面都得到近似的结果。在诺里斯的例子(2005)中,它将糖尿病前期病人、诊断为糖尿病的病人和没有糖耐量受损或空腹血糖受损的人分离开是明智的。您可能会认为一个评价中的干预过于广泛和多样,但是,干预往往是结合临床实践规范,具有临床意义的。总之,诺里斯的评价回答了一个明确界定和合理的问题。总之,一个非常广泛和全面的搜索已被出版。然而,评价可能因为没有检索到未发表的报告而受到出版的偏见。

(2)研究是否详细而全面?例子中的评价用适当的主题词和文章内容,搜索了与主题密切相关的8个主要数据库。Cochrane图书馆和科克伦为对照实验进行了全面搜查。为了要克服不正确的可能性索引,以及在电子搜索中可能遗失的章节,作者还手动搜查5个核心期刊与此相关的主题领域。被选中的关键词全部取自文章。总之,为了出版研究做了一个非常广泛和全面的搜索。但是,评价可能受到没有发表的研究的影响而产生偏倚。

(3)主要研究是否应用了高质量的方法论?不考虑研究的实力,非系统评价就报道研究结果。尤其是关于贫乏的研究结果往往趋向于高估干预的有效性(昆茨,奥克斯曼.1998)。系统评价告诉我们,某一专题在高质量和成果的条件下文献的状态。如果只有低质量的设计被使用,随机实验才是可能的话,评价只提供了明确的研究方向,但没有明确的做法方向。这次评价的例子(诺里斯等人,2005)只包括随机后至少12个月的随机实验。九项审判符合纳入标准。只有一个报道指出随机序列如何生成;没有足够的研究证明隐性分配;减少了4%~43%。包括在诺里斯评价里主要研究方法的质量是很高的。

(4)主要的研究评估可以重现吗?在随机实验里有不同质量的设计。评价中采用标准化模板,使用两个评价方法来评估独立研究的质量,利用共识来处理分歧。根据科克伦手册(克拉克&奥克斯曼,2001),模板评估研究方面的潜在选择、自然减员和监测偏倚,手册给出了研究质量的评估标准。作者列表包括研究中的文件抽样方法、随机过程、基线可比性的团体和减员。这种详细程度将允许读者复制的质量评估。

2.结果是什么

(1)研究之间的结果相似吗?您可以通过查看常用的Meta分析里的图形显示得到良好的意义上的相似性研究成果,这被称为“blobogram”。每个研究点估计(通常是一个正方形)和置信区间(横向线),并简要统计通常是一个钻石的垂直点的点估计和横向分占95%置信区间。莫里斯等人使用blobogram显示9个试验中平均减重的不同性,并分别结合3个Meta分析长度的后续行动的数据(1年、2年和>2年)(莫里斯,等.2005:35)。当个人的研究结果进行审查,但只有一项研究成果,有利于治疗组。每个研究的置信区间大多重叠,让我们决定结果的相近性。统计测试系统的异质性评估结果之间的差异的研究,不能归咎于偶然。假如结果有统计学意义,它表明各种试验的结果各不相同。因此,随机模型用于Meta分析,而不是一个固定效应模型。固定效应模型假设有一个单一的治疗效果,最准确地反映在研究;随机效应模型考虑到了非均质性方面的个人研究成果和置信区间的宽度(弗里曼特尔,格迪斯.1998)。

除了异质性测试,重要的是读者决定统计结合是否有临床意义。在这个例子中,作者结合了所有后续的干预结果。这是一种临床上有用的调查结果。此外,其他预先计划进行了比较,显示不同结果的干预效果[身体质量指数(BMI)、体重减轻、控制血糖和血脂]。如果各种研究人群,干预或结果大不相同,评价小组会作出决定去总结不同的结果,但不做Meta分析,也就是说,不采取步骤将统计学和结果相结合。但是,统计组合是一件合理的事情。随即试验不同的时间长度后的三元分析和总的研究Meta分析结合起来,既有统计学意义,又有临床应用价值。

(2)总体结果是什么?计票或增加了研究次数得到了有利于干预措施,但通过研究不给我们的估计马管加跨越的作用研究,并可能导致扭曲的结果(弗里曼特尔,格迪斯.1998)。例如,评价会发现一个最佳干预措施,但一次大型试验却显示没有区别。计票将导致错误的结论,这是干预的结果。然而,Meta分析将表明,干预是无效的。出于这个原因,只要有可能和具有临床意义,研究结果就和统计学的Meta分析相结合。在此评价例子中,减重的主要成果报道为试验组和对照组之间的平均差异。平均差异在1年是-2.8kg,2年是-2.6kg,研究报道的时间超过2年的,平均差异是-4.9kg(诺里斯,等.2005:25);因此,在所有的情况下,干预是有效的。

(3)结果的准确性如何?Meta分析可信区间围绕和点估计的都告诉我们,结果是否有统计学意义,并让我们知道结果的精确性。正如在初步研究中,真正的效果并不知道。可信区间告诉我们真正影响位于哪个范围。通过每个研究样本量的结合,在Meta分析中随着样本量的增加可信区间范围变窄间隔的信心变得更窄。在诺里斯评价中,参加2年以上研究的人员,失重平均差异在-4.9kg;95%可信区间是-6.7~-1kg(诺里斯,等.2005:25)。这表明结果有统计学意义,因为可信区间不包括0(体重没有减轻)。在许多Meta分析,结果是二分的(对事件,如死亡活着;住院或家庭;卒中或没有卒中);二分的数据,Meta分析的结果报告为构成比,可信区间不包括1是有统计学意义的。可信区间帮助临床医师利用结果作出决定。用和不用干预措施在可信区间的两端都相同的话,这个可信区间是足够精确的。在这个例子中,即使在可信区间的低端,决定实施干预结果可能都是相同的。

3.应该怎样应用结果呢

(1)应该怎样解释好结果以应用到照顾病人或政策决策中?从超过2年的减重干预措施的结果来看,体重减轻仍是有临床意义的。这就是说,即使实验组跟对照组比起来平均减重只有3.1kg左右,但这种差异可以降低糖尿病危险因素。进一步调查这个项目的花费和技术是值得的。区分每个研究的统计意义及临床意义是很重要的。理论上有可能评价会导致一个微小的但仍然有统计意义的结果,根据其他的研究,减重的不同对糖尿病风险没有影响。例如,平均体重变化0.5kg有统计学意义,但对糖尿病发病风险的降低影响不大。

(2)是不是所有重要的结果都必须考虑呢?这个评价详细列举了关于体重(体重指数、体重减轻百分比)和其他危险因素(血压、血脂、血糖控制)的其他结果。所有的结果都赞成干预组,其中包括在3~6年随访的结果中,有60%的研究中降低糖尿病发生率(诺里斯,等.2005)。没有研究报道病死率、生活质量或方案费用。

(3)评价的利益是否值得花费和潜在的风险?作为该方案的费用尚未确定,工作组不得不计算项目干预强度的费用。干预的风险不可预知。总之,除了可能出版的偏见,评价做得好和有一个明确的、重点突出的问题,彻底的研究,明确预先包容性和质量标准,并计划合理。利用饮食、身体活动和行为干预来减重和控制血糖的糖尿病前期,有微小的但显著的统计学意义和临床意义。

4.总结在一个特定临床问题上,系统的评价通常代表一个严格和深入的发现和将所有相关信息鉴定和合成的过程。对护士来说它们是有价值的,因为他们可以快速接触到预评价机构的工作。然而,并不是所有的系统评价都做得很好,并在实践中使用上述评价标准将确保您可以快速地评估,您对评价的结果是否有信心,是否有信心将成果应用于您的耐心、人口或政策决定。

(周 坚)

参考文献

[1]American Diabetes Association.Standards of medical care in diabetes.IV.Prevention/delay of type 2 diabetes.Diabetes Care,2005,28(S1):S7-8.

[2]Anonymous Review:non-pharmacological interventions induce or maintain weight loss in adults with prediabetes[abstract].Evidence-Based Nursing,2005,8:110.

[3]Ciliska D,Hayward S,bobbins M,et al.Transferring public health nursing research to health-system planning:Assessing the relevance and accessibility of systematic reviews.Canadian Journal of Nursing Research,1999,31(1):23-36.

[4]Ciliska D,Mastrilli P,Ploeg J,et al.The effectiveness of home visiting as a delivery strategy for public health nursing interventions to clients the prenatal and postnatal periods.Primary Health Care,2001,2:41-54.

[5]Ciliska D,DiCenso A,Guyatt G.Summarizing the evidence through systematic reviews.In:DiCenso A,Guyatt G,Cillska D,et al.Evidence-Based Nursing:A Guide to Clinical Practice Mosby,St.Louis,2005.

[6]DiCenso A,Ciliska D,Guyatt G.Introduction to evidence-based nursing.In:DiCenso A,Guyatt G,Cillska D,et al.Evidence-Based Nursing:A Guide to Clinical Practice Mosby,St.Louis,2005

[7]bobbins M,Cockerill R,Barnsley J.Factors affecting the utilization of systematic reviews.A study on public health decision makers.International Journal of Technology Assessment in Health Care,2001,17(2):203-214.

[8]bobbins M,Cockerill R,Barnsley J,et al.Factors of the innovation,organization,environment,and individual that predict the influence five systematic reviews had on public health decisions.International Journal of Technology Assessment in Health Care,2001,17(4):467-478.

[9]bobbins M,Thomas H,O’Brien MA.et al.Use of systematic reviews in the development of new provincial public health policies Ontario.International Journal of Technology Assessment in HealthCare,2004,20(4):399-404.

[10]Freemantle N,Geddes J.Understanding and interpreting systematic reviews and meta-analysis.Part 2:Meta-analyses.Evidence-Based Mental Health,1998,1(4):102-104.

[11]Haynes RB.of studies,summaries,synopses,and systems:the‘4S’evolution of services for finding current best evidence.Evidence-Based Nursing,2005,8:4-6.

[12]Jadad AR,Cook DJ,Jones A,et al.Methodology and reports of systematic reviews and meta-analyses:a comparison of Cochrane reviews with articles published in paper-based journals.Journal of the American Medical Association,1998,280:278-280.

[13]Kunz R,Oxman AD.The unpredictability paradox:review of empirical comparisons of randomized and non-randomized orals.British Medical Journal,1998,317:1 185-1 190.

[14]Norris SL,Zhang X,Avenell A,et al.Long-term non-pharmacologcial weight loss interventions for adults with prediabetes.Cochrane Database Systematic Reviews,2005,18(2):CD005 270.

[15]Ploeg J,Ciliska D,bobbins M,et al.A systematic overview of adolescent suicide prevention programs.Canadian Journal of Public Health,1996,87(6):411-412.

[16]gistered Nurses Association of Ontario,Toronto,Canada.Available at website.http://www.rnao.org/Page.asp?PageID=828,ContentlD=823Re/2006-04-30.

[17]Richardson WS,Wilson NC,Nishikawa J,et al,The well-built clinical question:A key to evidencebased decisions.ACP Journal Club,1995,123:A12.

[18]Sackett DL,Straus SE,Richardson WS,et al.Evidence-Based Medicine:How to Practice and Teach.London:Churchill Livingstone,2002.

[19]Thomas H,Boyle M,Micucci S,et al.Community-Based Interventions to Improve Child Mental Health:Review of Reviews.The Effective Public Health Practice Project.Last accessed March,http://old.hamilton.ca/phcs/ephpp/ReviewsPortal.asp,2002/2007.

[20]Thomas H,Ciliska D,Micucci S,et al.Effectiveness of Physical Activity Enhancement and Obesity Prevention Programs in Children and Youth(Healthy Weights Review).The Effective Public Health Practice Project.Lastaccessed,http://old.hamilton.ca/phcs/ephpp/Review Portal.asp,2004/2007-03

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈