首页 百科知识 癌症检查准确度探秘

癌症检查准确度探秘

时间:2022-03-18 百科知识 版权反馈
【摘要】:目前,各种癌症的发病原因至今尚未有明确的定论,对于晚期癌症基本上无法治愈.因此,癌症的早期诊断就成为我们战胜癌症的主要手段.癌症诊断的效果究竟如何呢?如果我告诉你,在一次肝癌普查中,有263人被测定为患有肝癌,可是真正患肝癌的只有1人.你会相信吗?
癌症检查准确度探秘_统计中的智慧

癌症是人类十恶不赦的敌人,国际社会将2月4日规定为世界癌症日.《2012中国肿瘤登记年报》显示,恶性肿瘤已上升至大城市居民死因第一位,超过了脑血管疾病.恶性肿瘤就是癌症,难怪人们总是谈癌色变.面对日益高发的癌症,我们该如何对付呢?目前,各种癌症的发病原因至今尚未有明确的定论,对于晚期癌症基本上无法治愈.因此,癌症的早期诊断就成为我们战胜癌症的主要手段.

癌症诊断的效果究竟如何呢?如果我告诉你,在一次肝癌普查中,有263人被测定为患有肝癌,可是真正患肝癌的只有1人.你会相信吗?这的确是事实!为什么会出现这样的结果?为了引进分析的方法,我们先看一个简单的例子.

例1 有一批产品,甲厂产品占25%,其不合格率为0.07;乙厂产品占50%,不合格率为0.08;丙厂产品占25%,不合格率为0.02.现在从这批产品中任取一件检查为不合格品,但是该件产品是由哪个厂生产的标志已经脱落.出了不合格品要追究有关厂的经济责任,求甲厂应承担多大责任?

解 设A表示“任取一件产品为不合格品”,B1表示“任取一件为甲厂产品”,B2表示“任取一件为乙厂产品”,B3表示“任取一件为丙厂产品”.于是有

P(B1)=25%,P(B2)=50%,

P(B3)=25%,P(A|B1)=0.07,

P(A|B2)=0.08,P(A|B3)=0.02.

可以考虑按条件概率P(B1|A)的大小来追究甲厂的经济责任.

由概率的乘法公式P(AB1)=P(A)·P(B1|A)可得

而这批产品中的不合格品由甲厂的不合格品、乙厂的不合格品、丙厂的不合格品3部分构成.于是有

P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)P(A|B3)=0.25×0.07+0.50×0.08+0.25×0.02=0.0625,

P(AB1)=P(B1)P(A|B1)=0.25×0.07=0.0175.

于是

因此,甲厂应承担28%的经济责任.依同样的方法可计算出P(B2|A)和P(B3|A),弄清乙厂和丙厂应承担的责任.在计算过程中,我们既考虑到各厂产品占全体产品的份额,也考虑了各厂产品的不合格率,如此分清各厂应承担的经济责任是比较合理的.

在上面的计算中,事实上我们已经在不知不觉中建立起一个非常有用的公式,即贝叶斯(Bayes)公式,现在将它加以一般化,表示成通常的定理形式.

定理 如果一个比较复杂的事件可以分解成若干个互不相容的较简单事件B1,B2,…,Bn的并,并且P(Bi)>0,i=1,2,…,n,则对任一事件A,有

这个定理对可列无限个互不相容事件也成立.

如果将B1,B2,…,Bn理解为n个互斥的“原因”,那么P(A|Bi)就是原因Bi引起事件A出现的可能性,P(Bi)是“原因”Bi本身出现(而不考虑它引起何种事件出现)的可能性,P(Bi|A)就是在事件A已经出现的条件下,A的出现是由原因Bi所引起的可能性.实践中常常会遇到这样的问题:事件A出现了,欲求它是由“原因”B1,B2,…,Bn中的哪一个引起的可能性最大.这时就可利用贝叶斯公式,先求出所有的P(Bi|A),再取其中最大的一个,比如说P(B1|A),因此就可以说,事件A的出现,由“原因”B1引起的可能性最大.

如果B1,B2,…,Bn是患者可能患的n种不同的疾病,在诊断前先检验与这些疾病有关的某些生理指标(如血压胆固醇、白细胞等).如果患者的某些指标偏离正常值,即事件A发生,要问患者患有哪一种疾病.从概率论的角度思考,如果条件概率P(Bi|A)比较大,那么患者患Bi病的可能性也比较大,要计算P(Bi|A),就可以使用上述的贝叶斯公式.现在就举一个癌症诊断的例子.

例2 根据调查,某地居民的肝癌发病率为0.0004.某医院使用甲胎蛋白法对肝癌进行普查.尽管这种检测方法可能是很精确的,但是它仍然会产生两种可能的误诊.首先,它可能会对某些患有肝癌的人作出没有肝癌的测定,这就是所谓的假阴性(false negative).其次,它可能对某些未患肝癌的人作出已患肝癌的测定,这就是所谓的假阳性(false positive).假设甲胎蛋白法能正确识别肝癌患者中的95%,因此5%的肝癌患者的测试结果将是“假阴性”.并且未患肝癌者中90%的测试结果为阴性,这就意味着未患肝癌者中的10%,其测试结果将是“假阳性”.在这次普查中查出一批测试结果为阳性的人,求这批人中真的患有肝癌的概率.

P(C)=0.0004,P)=0.9996,

P(A|)=0.10.

因为被检测者可能患肝癌,也可能不患肝癌,只有这两种情况,因此可利用贝叶斯公式求得

由此可知,经甲胎蛋白法检测为阳性的人群中,其中真正患有肝癌的人还是很少的,只有0.38%,即263人中仅有1人.

绝大多数被告知检测为阳性的人要无端地虚惊一场.为避免或减少出现这种不必要的惊慌,我们能够做些什么呢?我们可以尝试采取以下几种方法加以改进:

(1)努力提高检测的敏感度(sensitivity).所谓一种检测方法的敏感度是指,确实患病的人的检测结果呈阳性的概率.

假设我们的这种努力取得了惊人的成功,研制出了一种敏感度为100%的检测方法.于是,在上述例子中P(A|C)=100%,其余数据不变,由贝叶斯公式算得

只比原来的0.0038提高一点点,并没有多少改进.

提高敏感度还存在另一个问题,就是它也常常增加了假阳性的概率.这种检测方法可能是以某种物质的一个临界值为基础的.如果测量值高于这个临界值,我们就说检测呈阳性.提高检测敏感度的一种方法就是降低这个临界值.这样就会有更多的肝癌患者的检测结果为阳性.可是,同时也会有更多的未患肝癌者的检测结果呈阳性,即假阳性.

为了说明这种方法的缺点,假设检测的敏感度惊人地提高到100%,其代价是假阳性的百分比从10%提高到15%.于是P(A|C)=100%,P(A|)=15%,其余数据不变,由贝叶斯公式算得

这比原来的概率值0.0038还要小,可见这种方法不可取.

(2)尝试提高检测的特异性(specificity).所谓检测的特异性是指,确实未患肝癌者检测呈阴性的概率.显然,检测的特异性越高,假阳性的比例也就越小.

与原来的概率值0.0038相比,确有明显改进.

这与前面得到的0.0125没有很大差别,而与原来的0.0038相比有显著提高.

如果我们的主要目标是提高检测呈阳性者确实患有肝癌的概率的话,那么上述分析表明,我们应该将精力集中在提高检测方法的特异性上,即使这样做要付出降低检测的敏感度的代价.但是,我们应该清醒地意识到追求这个主要目标的提高,必定会使得更多的肝癌早期患者被误诊为阴性.

(3)影响检测结果的第三个重要因素是被检测群体的肝癌发病率.在例2中,肝癌发病率为0.0004,如果将这个发病率提高到0.004,那么一个检测为阳性者确为肝癌患者的概率将会有怎样的改变呢?重新用P(C)=0.004,P()=0.996代入贝叶斯公式,其余数据与例2相同,由计算可得

这与原来的概率值0.0038相比,有了很大的提高.

如果将肝癌发病率提高到0.04,即P(C)=0.04,按上述方法可以算得P(C|A)=0.284,如果将发病率进一步提高到0.1,即P(C)=0.1,可以算得P(C|A)=0.514,如果能将发病率再提高到P(C)=0.5,则可得到P(C|A)=0.90,也就是说,每100个检测为阳性的人中有90人确实患有肝癌.这个精确度已经相当高了.

由上面的讨论可以知道,发病率的提高对于医疗检测准确度的提高最为有效.可是,怎样才能提高发病率呢?通常一个有经验的医生,总是先进行仔细的问诊,并采用一些简单易行的辅助方法进行检查,当他怀疑某个对象有可能患肝癌时,再建议用甲胎蛋白法检测.这时,在被怀疑的对象中诊断出的肝癌发病率已经显著提高了.例如,如前所述,在被怀疑的对象中P(C)=0.5时,就可以得到P(C|A)=0.90,即高达90%的准确度.因此,对一些疑难病症,医生总要用几种不同的方法进行检测,这样可以大大提高诊断的准确度.

在例2中,进行一次甲胎蛋白检测,也就是进行了一次试验.P(C)是在试验之前就已经知道的概率,所以习惯上称它为先验概率,即先于试验的概率.实际上它是我们过去已经掌握的情况的反映,对试验将会出现的结果提供了一定的信息.而条件概率P(C|A)反映在试验以后,试验结果呈阳性(A)来自于肝癌患者(C)的可能性的大小,通常称之为后验概率,即后于试验的概率.

贝叶斯公式利用先验概率来算出后验概率.医生的丰富经验可以使先验概率P(C)(发病率)的值大大提高,从而极大提高检测的准确度.因此,人们总喜欢找有经验的医生看病.正是由于贝叶斯公式能有效地利用“经验”的知识(先验概率),帮助人们作出更加准确的判断,因此受到人们普遍重视,并称之为贝叶斯方法.贝叶斯方法现已成为统计学中一个非常重要的工具,并已形成以使用先验信息为其特征的贝叶斯统计学派.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈