首页 百科知识 估算医疗费用的一些统计方法

估算医疗费用的一些统计方法

时间:2024-04-08 百科知识 版权反馈
【摘要】:估算医疗费用的一些统计方法哥伦比亚大学 应志良复旦大学 杨亮吉 赵耐青医疗费用的估计是近年来医学统计(biostatistics)以及药物经济学(pharmacoeconomics)等领域里的一个重要的研究课题.本文有选择地介绍两类估算医疗费用的统计方法,并在此基础上提出新的建议和推广.§1 引  言随着国民经济的持续发展和生活水准的日益提高,医疗健康

估算医疗费用的一些统计方法

哥伦比亚大学 应志良

复旦大学 杨亮吉 赵耐青

医疗费用的估计是近年来医学统计(biostatistics)以及药物经济学(pharmacoeconomics)等领域里的一个重要的研究课题.本文有选择地介绍两类估算医疗费用的统计方法,并在此基础上提出新的建议和推广.

§1 引  言

随着国民经济的持续发展和生活水准的日益提高,医疗健康方面的开支也在不断增加,一个重要的问题就是如何精确地估算医疗费用的支出,包括如何预测各类患者或治疗方法所需的费用.

统计学的主要用途之一是利用已有数据建立有效的统计模型,从而推断目标总体的性质,尤其是其中一些有关的指标.在医疗费用方面,由于观察值具有纵向性,即是随时间推移而累积的,因此所获得的数据往往是不完全的,其中主要的一种不完全类型是所谓右截断的(right censored).这种不完全性的存在使得常用的统计方法失效,因而有必要对这类特殊的问题提出特殊的统计方法.

右截断数据是生存分析在统计分支的一个最主要的研究方面,而生存分析在公共卫生、临床试验、人寿保险金融工程、质量管理、社会经济学等重要领域有着广泛的应用.显然,利用生存分析领域中现成的统计方法去处理右截断的医疗费用数据是很自然的.

本文将着重介绍两类利用生存分析方法去估计平均医疗费用的统计方法.一类是由Lin等人在1997年Biometrics杂志上提出的方法,其基本原理是将整个时间段切割成一组小区间,对每个小区间分别估计其条件平均费用;另一类是由Bang和Tsiatis在2000年的Biometrika杂志上提出的方法,其原理是利用逆向概率加权(inverse probability weighting,IPW)去纠正右截断引入的偏差,IPW是抽样调查(sample surveys)中常用的一种获得无偏估计的统计方法.

本文还将提出一个新的估计方法.我们注意到现有方法的一个重要缺陷是没有充分考虑相邻时间段医疗费用的相关性,本文所提出的新方法将利用这种相关性以增加估计量的效率(efficiency)并减少可能的偏差.

本文结构安排如下:§2对生存分析作一个简介;§3介绍Lin等人所提出的方法;§4介绍Bang-Tsiatis的方法;§5提出一类新的估计方法;§6为结论.

§2 生存分析简介

生存分析是研究某种事件(如死亡、发病或愈合)发生时间的概率分布以及和其他因素(covariates)相关性的统计领域.主要方法有:Kaplan-Meier曲线(Kaplan and Meier,1958),Cox回归(Cox,1972)和log-rank检验(Mantel and Haenzel,1959)等常见方法.

Cox模型是生存分析中最常用的回归模型.设X为协变量,λ为危险率函数,则Cox模型定义为

λ(t| X)= eβXλ0(t),

其中λ0为基线危险率函数.回归系数β可以由最大化偏似然函数

log-rank检验统计量

§3 条件期望值方法

如果没有出现截断,那么每个人的医疗总费用WT均能被观测到,即样本是完全的,我们可以用样本均值去估计总体均值E(WT).

Lin等(1997)注意到

来估计.因而他们提出用

来估计平均医疗费用E(WT).

Lin等(1997)在其文中进一步证明了这个估计量的相合性(consistency)以及渐近正态性(asymptoticnormality),并给出了估计量方差的相合估计,他们用模拟的结果说明这个方法的合理性和实用价值,并用此方法对一组卵巢癌患者的数据进行了统计分析

在医疗费用的统计分析中,一个有意义的问题是如何建立费用与协变量X的关系.Lin在2000年提出了Y(t)与X的边际回归模型,并给出了这类模型下回归系数的估计方法.

§4 逆向概率加权法

逆向概率加权法(IPW)是抽样调查领域中一个常见的方法(Lohr,1999).这种方法被Koul等(1981)运用于截断数据的线性模型.Robins及其合作者提出了用IPW构造半参数有效估计的一类方法(RobinsandRotnitzky,1992;Robinsetal.,1994).

Bang和Tsiatis(2000)提出了用IPW方法估计医疗费用的方法,我们在这里作一个扼要的介绍.用§3的符号,个人总医疗费用能被表达成

WT=∫I(T≥t)Y(t)μdt.

所以我们也可以用

§5 分层估计法

另一个方面,在§4中介绍的Bang-Tsiatis方法是先对每个患者的总费用进行估计,然后再取平均得到总体的总费用期望值.显然,这种做法与Lin等所提出的具有本质的区别.

就前几节所述,当δ= 0时,患者的费用资料只有Y(t),t≤C.对于任意t>C,

E[I(T≥t)Y(t)| Y(C),C]

 = E[Y(t)| Y(C),T≥t]P[T≥t|Y(C)].

记C的取值为t0<t,Y(C)的值为y0,则我们可以用分层的方法分别估计E[Y(t)|Y(t0)= y0,T≥t]和P[T≥t|Y(t0)= y0]的值,即对Y的值域进行分割,由此得到对患者的分层,用与y0同一层的患者估计E[Y(t)| Y(t0)= y0,T≥t]和P[T≥t| Y(t0)= y0].

由此我们可以用

因为

在一些正则条件下,我们可以很容易地证明所提出的估计量的相合性,然而其渐近正态性并非显而易见,其主要原因为分层或核光滑会使理论性质的推导复杂化,但我们认为只要分层足够细或核光滑的窗宽足够小,那么所得到的估计量应具有渐近正态性.

§6 结  论

本文主要讲述如何对有截断的医疗费用数据进行统计分析,简要介绍了两类主要方法:一类是Lin等在1997年提出的基于条件期望的方法;另一类为Bang和Tsiatis在2000年提出的基于逆向概率加权的方法.在对这两类方法进行分析后,提出了基于分层或核光滑的一类新方法.

参考文献

[1]Bang,H.,and Tsiatis,A.A.Estimating medical costs with censored data.Biometricka,2000,87(2),329-343.

[2]Bang,H.,and Tsiatis,A.A.Median regression with censored cost data.Biostatistics,2002,58,643-649.

[3]Cox,D.R.Regression models and life tables.Journal of the Royal Statistical Society,1972,34,187-220.

[4]Kaplan,E.L.,and Meier,P.Nonparametric estimation from incomplete observations.Journal of the American Statistical Association,1958,53,457-481.

[5]Koul,H.,Susarla,V.,and Van Ryzin,J.Regression analysis with randomly right-censored data.The Annals of Statistics,1981,9(6),1276-1288.

[6]Lin,D.Y.Linear regression analysis of censoredmedical costs.Biostatistics,2000,1,35-47.

[7]Lin,D.Y.,Feuer,E.J.,Etzioni,R.,and Wax,Y.Estimating medical costs from incomplete follow-up data.Biometrics,1997,53(2),419-434.

[8]Liu,L.,Wolfe,R.A.,and Kalbfleisch,J.D.A shared random effectsmodel for censored medical costs and mortality.Statistics in Medicine,2006,26(1),136-155.

[9]Lohr,S.L.Sampling: Design and Analysis.Duxbury Press,1999.

[10]Mantel,N.,and Haenszel,W.Statistical aspects of the analysis of data from retrospective studies of disease.Journal of the National Cancer Institute,1959,22,719-748.

[11]Robins,J.M.,and Rotnitzky,A.Recovery of information and

adjustment for dependent censoring using surrogatemarkers.In AIDS Epidemiology: Methodological Issues,Jewell NP,Dietz K,Farewell VT(eds).Birkhauser: Boston,1992,297-331.

[12]Robins,J.M.,Rotnitzky,A.,and Zhao,L.P.Estimation of regression coefficients when some regressors are not always observed.Journal of the American Statistical Association,1994,89,846-866.

注:本文作者为美国哥伦比亚大学教授、复旦大学数学科学学院特聘教授应志良博士,复旦大学数学科学学院研究生杨亮吉和复旦大学医学院赵耐青教授.

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈