首页 百科知识 中老年人代谢综合征相关分析及其应用

中老年人代谢综合征相关分析及其应用

时间:2022-04-08 百科知识 版权反馈
【摘要】:中老年人代谢综合征相关分析及其应用复旦大学 王奕渲 李荣敏 陆振华第二军医大学 朱德增上海市延吉社区卫生服务中心 夏正常§1 引  言流行病学研究发现,随着社会经济的发展和人们生活水平的提高,高血压、糖尿病、血脂紊乱、肥胖等多种代谢异常同时发生于同一个体的现象越来越多.在西方,一些国家把这组疾病称为X综合征、胰岛素抵抗综合征或富裕性疾病.对于这

中老年人代谢综合征相关分析及其应用

复旦大学 王奕渲 李荣敏 陆振华

第二军医大学 朱德

上海市延吉社区卫生服务中心 夏正常

§1 引  言

流行病学研究发现,随着社会经济的发展和人们生活水平的提高,血压、糖尿病、血脂紊乱、肥胖等多种代谢异常同时发生于同一个体的现象越来越多.在西方,一些国家把这组疾病称为X综合征、胰岛素抵抗综合征或富裕性疾病.

对于这种代谢性疾病的集结,1999年,世界卫生组织建议统一使用“代谢综合征”(metabolic syndrome,MS)的概念,定义为:糖尿病、糖耐量降低或者胰岛素抵抗伴随以下各项中的两项异常:动脉血压升高、血浆甘油三酯升高、腹型肥胖、微量白蛋白尿,即多种代谢异常集结发生于同一个体的现象.代谢综合征的病因目前尚不十分清楚,但一般认为代谢综合征是在遗传的背景下由不良生活方式导致的.

目前,代谢综合征已经成为全球范围内的一项重要的公共卫生问题.欧美国家有着较高的患病率,亚洲国家的患病率虽然相对较低,但是有上升的趋势.在我国,随着国民经济的发展和人民生活水平的提高,膳食结构和营养状况发生了很大的变化并引起富裕型疾病患病率增加.2002年8月至12月,由卫生部组织的各省、自治区、直辖市相关部门在全国范围内开展的“中国居民营养与健康状况调查”显示,我国成人代谢性疾病的患病率与1991年和1992年的调查相比,呈明显上升趋势并且有集结现象.

此外,一些国家和地区曾对代谢综合征对心脑血管疾病的影响做了深入研究,结果显示代谢综合征患者人群发生心脑血管疾病、冠心病的风险较非代谢综合征患者人群大.而心血管疾病是目前全球第一位的死亡因素,在发达国家中占所有死亡原因的40%.然而,一方面,代谢综合征的患病情况本身存在显著的地区和人群差异;另一方面,采用不同的代谢综合征诊断标准对研究代谢综合征的患病情况也将得到不同的结论.目前代谢综合征的诊断标准有多个,例如世界卫生组织(WHO)标准、美国胆固醇教育计划(NCEP-ATPIII)标准、国际糖尿病联盟(IDF)标准、美国临床内分泌医师协会(AACE)标准,以及中华医学会糖尿病分会(CDS)标准等.

本文将利用2005年12月至2006年12月所采集的上海市杨浦区延吉社区的问卷调查数据和体格检查数据,对中老年人群代谢综合征患病情况及代谢综合征相关问题进行研究.在分析代谢综合征发病率和代谢性疾病并发情况的基础上,用Logistic回归模型对代谢综合征的危险因素进行识别,并通过设定恰当的门槛值将个体按代谢综合征的患病可能性大小进行分类,以期运用在保险公司的核保工作中.

在§2中,首先进行数据情况说明,介绍了调查问卷和体格检查数据的来源、数据采集和数据处理过程.在§3中,先对CDS和IDF两种定义下研究对象的年龄构成标化代谢综合征患病率及代谢异常率进行比较分析,然后将样本按照10岁一组进行分组,对10个性别/年龄组下的患病率或代谢异常率进行分析和比较,得到CDS标准更适用于本次研究对象的结论.在§4中,使用聚类分析研究各种代谢异常或代谢疾病之间的相互关系,通过对样本进行一系列的分割或者合并,得到代谢性疾病并发可能性的相关结论.在聚类时,参照中华医学会糖尿病分会(CDS)提出的代谢综合征诊断标准,将肥胖、糖代谢异常、高血压、脂代谢异常这4种代谢性问题进行并类分析.在§5中,采用Logistic回归模型,在考虑个体其他特征以及各特征间交互作用的同时,得到代谢综合征患病与各因素之间的关系.对回归模型的拟合情况、预测能力进行检验.识别代谢综合征的危险因素并分析其对患病率的影响将有利于做好代谢综合征的一级预防工作及降低患病率.最后,在§6中,把调查人群分为建模集和检验集,建立并检验代谢综合征风险判别模型以实现对每个个体患病风险的估计;通过设立适当的门槛值,将个体按照代谢综合征患病可能性大小分成3个风险等级;并考虑将该模型运用到保险公司的核保工作中,帮助人寿保险公司提高核保工作效率,例如,在简单核保阶段,根据被保险人的基本信息,识别被保险人的患病风险并做出相应的核保决定等.

本项研究工作及相关调查是在复旦大学数学科学学院、第二军医大学中医系及上海市杨浦区延吉社区的共同合作下进行的,参加工作的有复旦大学数学科学学院的王奕渲博士、李荣敏副教授和研究生陆振华,第二军医大学中医系的朱德增教授、研究生刘欣燕和赵淑丽,延吉社区卫生服务中心的夏正常院长、贡东卫副院长和张韶伟副院长.

§2 数据情况及处理

本次研究使用的数据源于第二军医大学中医系与复旦大学数学科学学院合作的“上海市杨浦区延吉社区代谢综合征流行病学调查”项目,数据采集时间为期一年,从2005年12月至2006年12月.

研究对象为40—90岁同时接受了问卷调查和体格检查的中老年人,总计1 807人,其中女性1 150人,男性657人.使用按统一格式设计的调查表,在对调查人员进行必要的培训且在培训合格后进行调查.本次进行的流行病学调查内容包括一般人口学特征、血压、血脂、血糖、吸烟、饮酒、相关疾病情况(包括高血压、冠心病、糖尿病、高血脂病史及其家族病史、个人用药、诊断治疗史等).调查表见附件.

所有研究对象填写了调查问卷,并参加了人体测量和采血.人体测量包括身高、体重、腰围,血压测量采用汞柱式标准袖带血压计,根据调查对象的上臂围选择适当袖带,取坐位至少休息5分钟以上测量右上臂收缩压和舒张压.此外,对研究对象在空腹8小时以上采取静脉双份血清测定空腹血糖(FBG)、总甘油三酯(TG)和高密度脂蛋白胆固醇(HDLc).

在问卷和体格检查资料收集完毕后初筛原始问卷.用Visual FoxPro 6.0软件建立数据库,双人双份录入.资料输入完毕后抽查其中10%与原始资料核对,以确保资料输入的质量.用统计分析软件对数据进行逻辑纠错,并用描述性方法和作图法发现和处理歧异点.对于有歧异点和信息遗漏的样本,通过上门回访或电话询问将信息更正和补全.

所有数据经整理处理后用SPSS 11.5软件进行相应的统计学分析和处理.

本文使用的自变量包括连续变量和分类变量.

连续变量包括:年龄Age,体重指数BM I=体重/(身高的平方)(kg/m2),腰围WC(cm),腰围身高比WHR=腰围/身高,腰围体重身高比WWHR=腰围×体重/身高(kg),收缩压SBP(mm-Hg),舒张压DBP(mmHg),空腹血糖FBG(mmol/L),甘油三酯TG(mmol/L),高密度脂蛋白胆固醇HDLc(mmol/L).

分类变量包括问卷调查中可能与代谢性疾病的发生有关系的信息,如:个人基本信息、生活习惯、疾病史和家族病史等,并在做统计分析之前对其进行必要的处理和量化,见表1.

表1 分类变量列表

§3 CDS和IDF两种定义下患病率的比较

3.1 CDS和IDF对代谢综合征的定义

中华医学会糖尿病分会(CDS)在2004年4月27日召开的“中国人的代谢综合征与胰岛素抵抗研讨会”上提出了适合中国人代谢综合征的诊断标准,称之为CDS标准,符合以下4个组成成分中的3个或全部者即可诊断为患有代谢综合征:

(1)超重或肥胖:体重指数(BM I)≥25.0 kg/m2;

(2)高血糖:空腹血糖(FBG)≥6.1mmol/L,及(或)糖负荷后血糖≥7.8mmol/L,及(或)已确诊为糖尿病并治疗者;

(3)高血压:收缩压(SBP)≥140mmHg或舒张压(DBP)≥90mmHg,及(或)已确诊为高血压并治疗者;

(4)血脂紊乱:空腹甘油三酯(TG)≥1.7mmol/L,及(或)空腹血高密度脂蛋白胆固醇(HDLc):男性<0.9mmol/L,女性<1.0 mmol/L.

2005年4月,在第一届国际糖尿病暨代谢综合征大会上,定义了国际学术界第一个代谢综合征的全球统一定义.在这次会议上,国际糖尿病联盟IDF(Internaional Diabetes Federation)对代谢综合征的定义以中心性肥胖为核心,其中中心性肥胖采纳腰围(WC)作为诊断指标.IDF标准与CDS标准有一些差别.IDF的定义强调中心性肥胖并将腰围作为肥胖指标,并建议对不同地区的人群使用不同的肥胖标准.而在CDS标准下,肥胖指标是体重指数BM I,并且肥胖并非代谢综合征的必要诊断条件.

根据IDF的诊断标准,对于中国人,当男性腰围≥90 cm,女性腰围≥80 cm,合并以下4项指标中任意两项即可诊断患有代谢综合征:

(1) TG水平升高:≥1.7mmol/L,及(或)已接受相应治疗;

(2) HDLc水平降低:男性<1.04mmol/L,女性<1.30mmol/ L,及(或)已接受相应治疗;

(3)血压升高:SBP≥130mmHg或DBP≥85mmHg,及(或)已接受相应治疗或此前已被诊断为高血压;

(4)空腹血糖升高:FBG≥5.6mmol/L,及(或)已接受相应治疗或此前已被诊断为Ⅱ型糖尿病.

其中,对中国人的腰围标准主要使用中国上海市和中国香港的流行病学资料(男性腰围≥90 cm,女性腰围≥80 cm),本文将以此为肥胖标准分析IDF定义下的代谢综合征患病率.

本节对CDS标准和IDF标准进行比较分析是基于下述两个原因:

本次采集的体格检查数据类型是以CDS标准为依据的,根据所进行的几项血液检查和问卷调查可以对个体在CDS标准下是否患有代谢综合征进行判断;

IDF标准是2005年国际糖尿病联盟提出的新的代谢综合征诊断标准,所使用的诊断指标及变量与CDS标准的类似,便于比较.

仅从两种对代谢综合征的定义来看,IDF定义下高血压的标准和糖代谢异常的标准比CDS的严格.至于肥胖及脂代谢异常定义的严格性则因特定人群而会有所不同.

此外,根据CDS的建议,40岁以上的中老年人群为代谢综合征的高危人群,因此本文可以看作是对代谢综合征高危人群进行的一项有关代谢异常情况以及代谢性综合征的调查及相关应用问题的研究.

3.2 CDS和IDF定义下的比较分析

本节对所调查的中老年样本人群在CDS和IDF两种定义下的代谢异常和代谢综合征患病情况进行比较分析.

根据2005年上海市人口普查数据,本次调查样本(40—90岁人群)的代谢综合征年龄构成标化患病率在CDS标准下为19.8%(男性)和15.0%(女性);在IDF标准下为19.2%(男性)和30.3%(女性),见图1.

图1 CDS和IDF定义下代谢综合征患病率及其在性别间的差异

由图1可知:

(1)在CDS标准下,男性的代谢综合征患病率略高于女性,而在IDF标准下,女性的患病率则远高于男性,即两个标准在诊断男性和女性患病率方面有明显差异;

(2)对于男性样本,CDS标准下的标化代谢综合征患病率略高于IDF标准下的标化患病率,即CDS标准比IDF标准稍微严格一些;而对于女性人群,IDF标准下的标化代谢综合征患病率远高于CDS标准下的标化患病率,即IDF标准对于女性中老年人比CDS标准更为严格.

图2和图3所示是分别在CDS和ZDF标准下对标化代谢异常发生率所做的性别间比较.

图2 CDS标准下的代谢异常发生率

图3 IDF标准下的代谢异常发生率

图2显示,在CDS定义下,性别之间存在明显差异的是高血压;而由图3可知,在IDF标准下,性别之间存在显著差异的有:肥胖、高血压和低HDLc.

为了更好地比较两种定义下代谢综合征患病率和代谢异常发生率的状况和差异,将样本按10岁一组进行分组:40—50岁,51—60岁,61—70岁,71—80岁,以及80岁以上,共5个年龄段,这样一共得到10个性别/年龄样本组.

各性别/年龄样本组的分类变量和连续变量的基本特征列于表2至表5中.

表2 男性分年龄组样本分类变量基本特征(%)

表3 女性分年龄组样本分类变量基本特征(%)

表4 男性分年龄组样本连续变量特征(均值和标准误差)

表5 女性分年龄组样本连续变量特征(均值和标准误差)

在表4和表5中,WHR为腰围身高比(=腰围/身高); WWHR为腰围体重身高比(=腰围×体重/身高).

接下来,对CDS和IDF两种代谢综合征标准下代谢综合征患病率、代谢性疾病患病率或代谢异常率按性别/年龄组进行统计,见表6和表7.

表6 CDS和IDF定义下男性中老年人群代谢异常率(%)

表7 CDS和IDF定义下女性中老年人群代谢异常率(%)

通过表6和表7对两个标准下代谢异常发生率的描述,可以得到如下结论:

(1)IDF标准和CDS标准下调查对象的代谢异常情况有较大的差异,无论是男性还是女性,各年龄段的代谢异常发生率或代谢性疾病患病率均等于或高于CDS下的发生率;

(2)对于不同年龄段的人群,两个标准下的性别间的差异程度不相同;

(3)两个标准的一致性表现在:除少数代谢异常项目外,两个标准下发生率最高和最低的年龄段是相同的;

(4)代谢异常发生率和代谢综合征患病率并非随着年龄的增长而增加.男性代谢异常发生率最高的年龄段分别为肥胖(71—80岁)、糖代谢异常(80岁以上)、高血压(71—80岁(CDS标准)和80岁以上(IDF标准))、高TG(40—50岁)、低HDLc(40—50岁)和代谢综合征(51—60岁);女性代谢异常发生率最高的年龄段分别为肥胖(61—70岁)、糖代谢异常(61—70岁(CDS标准)和80岁以上(IDF标准))、高血压(61—70岁(CDS标准)和80岁以上(IDF标准))、高TG(61—70岁)、低HDLc(40—50岁)和代谢综合征(61—67岁).

从男性和女性在代谢综合征患病率的差异上来看,CDS标准应该更适合本次调查的中老年人群.因此,在接下来的研究中都将采用或参照CDS标准.

§4 代谢性疾病之间的相互关系

代谢综合征为多种代谢异常集结发生于同一个个体的现象,而各种代谢问题之间存在着一定的关系,对代谢性疾病在统计学意义上相互关系的分析可以看成是对代谢性疾病并发问题的研究.本节参照中华医学会糖尿病分会提出的代谢综合征诊断标准定义肥胖、糖代谢异常、高血压、脂代谢异常,将代谢异常发生与否看作变量,采用变量聚类的方法,对它们进行并类分析,研究疾病并发的问题.

4.1 聚类分析模型

聚类分析的要点有两个:一是要确定分类统计量,以表明类与类之间的关系;二是要确定一种并类规则.对于分类统计量可以使用样本之间的距离,即将每一样本看作一个点,并在空间定义距离,将距离较近的点归为一类,距离较远的点认为不属于一类;另外,对于分类统计量也可以采用类与类之间相似程度的系数,性质越接近的样本之间的相似系数越接近1或(-1),而彼此无关的样本之间的相似系数则接近于0,从而将相似样本归为同一类.

事实上,并类的规则通常根据实际问题进行选择,本节采用相

似性最大的两类首先合并的方法.具体方法为:先将4种代谢性问题(肥胖、糖代谢异常、高血压、脂代谢异常)各自看作一类,然后定义类与类之间的相似性系数,把最相似的变量先聚类,接着计算由聚类得到的新的类与其他类之间的相似性系数,再将最相似的两类聚类,直至综合成一个大类.

将样本记为X,样本容量为n.是否出现代谢异常分别用1和0表示,并用Y1,Y2,Y3,Y4分别表示肥胖、糖代谢异常、高血压和脂代谢异常这4个变量.记为X=(Y1,Y2,Y3,Y4),例如,若第i个调查对象有糖代谢异常和脂代谢异常,则可记为Xi=(0,1,0,1).如果某一样本的两个变量的取值相同(同时取0或同时取1),则称它们在此样本上是匹配的;反之,若两变量中一个为0,另一个为1,则称它们在此样本上是不匹配的.仍以样本Xi=(0,1,0,1)为例,则肥胖和高血压、糖代谢异常和脂代谢异常是匹配的,其他的情形为不匹配.然后根据所有n个样本的匹配数和不匹配数研究两个变量的相似性.显然,两个变量匹配数所占比例越大,可认为两变量之间的相似性越强,之间的距离也就越小;反之,不匹配数所占比例越大,相似性越弱,之间的距离也就越大.

对于取值为0和1的二分变量,用列联表方式表示匹配数和不匹配数.以肥胖Y1和糖代谢异常Y2为例,由n个样本得到的列联表如表8所示.

表8 0,1编码的列联表示例

4.2 4 种代谢异常的聚类结果

利用4.1中的模型和对相似性系数的定义,根据样本信息可以得到4种代谢性问题之间的匹配数和不匹配数以及变量两两之间的相似性系数,见表9.

表9 4种代谢异常变量的列联表

将两两之间的相似性系数排列成一个4×4矩阵:

根据相似性系数的大小,可知高血压与脂代谢异常的相似性最大,即它们之间的距离最近;肥胖与高血压、肥胖与脂代谢异常的相似性居中;肥胖与糖代谢异常、糖代谢异常与高血压、糖代谢异常与高血脂的相似性相对最小.

把相似性最大的高血压Y3和脂代谢异常Y4首先合并成一类{Y3,Y4},显然,处于同一类的代谢异常或疾病间并发的可能性大于非同类疾病并发的可能性.考虑到并发病之间的特征,合并后新的类{Y3,Y4}与其他类的相似性系数取为各变量(如Y3和Y4)与其他类中变量的相似性系数中的最大者.用Ru,v代表u类和v类的相似性系数,则

则新的矩阵为

Y1与{Y3,Y4}的相似性最大,Y2与{Y3,Y4}的相似性居中,Y1与Y2的相似性最小.最后,将聚类过程用图4表示.

由聚类分析的结果可知,高血压和脂代谢异常并发的可能性最大,其次为肥胖与脂代谢异常,然后依次为肥胖与高血压,糖代谢异常与高血压,糖代谢异常与脂代谢异常,肥胖与糖代谢异常.

图4 4个代谢问题的聚类过程

§5 代谢综合征的风险识别模型

5.1 代谢综合征因素分析

将CDS标准下是否患代谢综合征(CDSMS)视为因变量,取值1和0,分别表示患病和没有患病.建立风险识别模型时使用的自变量列于表10中.

表10 代谢综合征相关风险变量

然后,采用向前逐步法,利用表10中的自变量做Logistic回归,同时考虑各因素间的交互作用,并取FE= 0.05,FD= 0.1,得到代谢综合征发生与否和各风险因素的关系:

=-15.481+0.027Age+1.158Diafam

 +0.684Hypfam+0.372BM I+4.831WHR

其中p为在选定自变量的条件下CDSMS= 1的概率.

5.2模型拟合优度及预测能力

回归系数的显著性检验使用Wald检验:

表11 回归系数的显著性检验

由表11可知,在0.05的显著性水平下,5个因素(年龄、糖尿病家族史、高血压家族史、BM I和WHR)对个体是否患有代谢综合征有显著的影响.

当自变量是离散变量时,可以用Pearsonχ2统计量或者偏差来描述拟合优度,对于回归模型中的年龄、BM I和WHR这3个连续变量,采用Hosmer-Lemeshow拟合优度指标(HL).

按照预测发生概率的大小将数据分成规模大致相同的10组,并按预测概率升序排列,第一组包括估计发生概率最小的那些样本,最后一组包括估计发生概率最大的观察样本.计算HL指标:

将HL与自由度为8(=10-2)的χ2分布做比较,检验不显著(例如p-值≥0.1)说明模型拟合数据,这种检验方法与下一节要做的风险分类的目的也是一致.表12给出了回归模型(1)的HL拟合优度检验.

表12 回归模型的Hosmer-Lemeshow拟合优度检验

注:*表示p-值= 0.152≥0.1.

由表11和表12可见,模型(1)能够较好地拟合样本数据.其中离散变量Diafam和Hypfam的优势比(OR)分别为3.183和1.983,也就是说,有糖尿病家族史者患代谢综合征的可能性是没有糖尿病家族史者的3.183倍;有高血压家族史者患代谢综合征的可能性是没有高血压家族史者的1.983倍.优势比OR是对未知总体发生比率的点估计,其95%的置信区间分别为(2.152,4.709)和(1.478,2.660),从Diafam的OR的置信区间可以看出,有糖尿病家族史者患有代谢综合征的可能性相比没有糖尿病家族史者而言,至少为2.152倍,至多为4.709倍.可见,糖尿病家族史是代谢综合征的一个重要患病因素.高血压家族史对代谢综合征的促使作用虽然不及糖尿病家族史显著,但仍然是一个十分重要的因素.

对于连续变量(年龄、BM I和WHR),表11也列出了它们的OR值和置信区间.其中OR值的含义是自该变量增加1个单位时,导致代谢综合征患病概率增加的倍数.可知,对于每一个个体而言:年龄每增加1岁,发生比率增加2.7%;体重指数BM I每增加1个单位,发生比率增加45.1%;腰围身高比WHR每增加1个单位,发生比率增加62.1%.然而,由于这3个连续变量在1个单位上的变化并不等价,因此接下来使用偏标准化系数β∧k来比较因变量与不同连续变量之间的关系.

定义偏标准化系数为

表13 Age,BM I和W HR的偏标准化系数

通过对Age,BM I和WHR的回归系数进行偏标准化可知,在这3个风险因素中,BM I对代谢综合征患病发生比率的影响最强,年龄次之,WHR相对最弱.

定义观测数据对为观测到的反应变量不相同的两两数据的对数,即观察值取0的频数乘以观察值取1的频数.在一个观测数据对中,如果观测的反应值为1的预测概率大于观测值为0的预测概率,就定义该观测数据对为和谐的;反之,为不和谐的;如果一个观测数据对既不是和谐的也不是不和谐的,就称为结.定义下面两个次序指标:

其中nc是和谐对的数目,nd是不和谐对的数目,t是所有不同反应值的观测数据对的总数.Gamma指标由于没有考虑结的数目,所以倾向于高估预测概率与反应变量状况之间的关联度;而Somer'D指标是Gamma指标的一种扩展,它的值总是小于Gamma指标.Gamma值和Somer'D值越大,说明模型的预测能力越强.

对于前面所建立的Logistic回归模型,经计算,观测数据对共474 672个,其中一致对的比例为83.6%,不一致对的比例为16.2%,结为0.2%,t= 1,从而两个次序指标分别为:

这两个指标都比较高,说明模型的预测效果较好.

§6 代谢综合征因素分析在核保中的应用

6.1 背景介绍

核保是保险公司自我防范、化解风险、持续经营的重要措施之一,也是保险公司在全体客户中保持公平性的一个必要条件.核保的目的是使同一风险类别的个体达到一致(同质化),从而保持保险费公平合理的危险选择过程.核保人的危险选择是在代理人、体格检查医生、调查人员危险选择的基础上,根据自己的专业知识及过往经验对客户的健康状况进行判断,并最终决定是否承保以及以何种条件承保的过程.核保工作中使用的一般风险因素包括性别、年龄、职业、嗜好(如吸烟、饮酒)等,考虑的健康风险因素有体格、疾病史、家族病史等.

医学研究表明,代谢综合征患者患冠心病、心脑血管疾病的危险程度较非代谢综合征人群高,心脑血管疾病是目前全球第一位的死亡原因,在发达国家中占所有死亡原因的40%,远超过恶性肿瘤的死亡率.为了评估代谢综合征与心血管疾病的关系,芬兰和瑞典曾进行了一项大样本研究,4 483名年龄在35—70岁的患者参加了调查,用世界卫生组织(WHO)提出的代谢综合征诊断标准评价与代谢综合征相关的心血管患病率和死亡率,研究显示:患有代谢综合征的人群比未患代谢综合征人群的面临心脑血管疾病的危险增加了3倍,心血管疾病死亡率明显增高.1984—1989年,对1 209名42—60岁尚未诊断为心血管疾病、癌症和糖尿病的芬兰居民的随访调查(持续到1998年)表明:代谢综合征患者(WHO标准)心血管疾病死亡率是非代谢综合征患者的2.6—3.0倍,冠心病死亡率是2.9—3.3倍,全因死亡率是1.9—2.1倍.瑞士再保险公司曾对35 470名在1986—1997年投保的个体进行调查分析,结果显示,在NCEP标准下,代谢综合征患者的全病因死亡率和心血管疾病死亡率分别是非代谢综合征患者的1.16倍和1.45倍.

本节的目的是希望通过定义和分析代谢综合征的患病风险因子帮助保险公司提高核保工作的效率.例如,保险公司可以考虑利用投保书中的信息,特别是代谢综合征的风险因素(如年龄、体重、身高、腰围、家族病史等),运用代谢综合征患病风险模型对被保险人进行快速审核和电脑核保,如果被保险人符合保险人对代谢综合征风险控制的要求,则属于低风险的标准体或完美体,并进行快速核保;否则,若被保险人不符合保险人对代谢综合征的风险控制要求,则可由核保人员对其患病风险进行评估,并决定是否承保或是否有必要做进一步的体格检查,从而实现提高核保效率和节约费用的目的.

6.2代谢综合征风险等级判别模型

医疗保险的角度出发,不仅要根据投保信息确定个体是否已经患有代谢综合征,更为重要的是如何在信息不充分的条件下,利用现有资料识别可能患有代谢综合征的被保险人,进而做出加费、拒保或体格检查的核保决定.

仍然运用Logistic回归模型,对每一个个体定义一个风险系数r,并试图找到两个门槛值r1,r2,通过比较个体的风险系数与门槛值的大小,将个体归入低、中或高风险等级,即

若r<r1,那么个体属于低风险等级;

若r1≤r<r2,那么个体属于中风险等级;

若r≥r2,那么个体属于高风险等级.

其中r1,r2的选取是使低、中、高3个风险等级的代谢综合征患病率差异最大.

为了检验定义的风险系数和风险系数门槛值是否合理,将样本分为建模数据集和检验数据集,其中建模集由随机抽取的60%的样本(1 090人)构成,检验集由剩余40%的样本(717人)构成.

下面对建模数据集直接采用向前逐步Logistic回归,同时考虑各因素间的交互作用,取FE= 0.05,FD= 0.1,得到代谢综合征患病情况与各风险因素的关系:

=-15.279+0.024Age+ 1.076Diafam

 +0.651Hypfam+0.369BM I+ 5.004WHR.    (2)

模型(2)的Hosmer-Lemeshow拟合优度检验如表14所示.

表14 建模数据集Logistic回归模型的Hosmer-Lemeshow拟合优度检验

注:*表示p-值= 0.368≥0.1.

拟合结果显示模型(2)能够较好地拟合建模集样本数据.

根据一致对、不一致对和结的定义,在模型(2)的所有数据对中,一致对有82.7%,不一致对有17.1%,结为0.2%.因此次序统计量分别为Somer'D= 0.656和Gamma= 0.658.可见,模型有较好的预测能力.

定义每一个个体的风险系数等于Logistic回归模型中预测代谢综合征发生的概率

与风险系数r有关的风险因素包括Age,BM I,WHR,糖尿病家族史和高血压家族史.

利用数值方法,得到使所构造的低、中、高3个风险等级的代谢综合征的患病率差异最大的风险系数门槛值r1= 0.06和r2= 0.33.按照由此标准确定的风险等级,低风险等级的实际代谢综合征患病率为2.7%,中等风险等级的实际代谢综合征患病率为15.5%,高风险等级代谢综合征患病率等于51%.高风险等级人群的实际患病率是低风险等级实际患病率的19倍,这就从一个方面说明由此得到的低、中、高风险等级的人群在代谢综合征患病风险上的确存在很大的差异,代表了3种不同等级的风险,有较好的区分度.

为了进一步检验模型的预测能力,把代谢综合征风险识别模型(2)应用于检验数据集,得到模型的Hosmer-Lemeshow拟合优度检验表15.

表15 检验数据集Logistic回归模型的Hosmer-Lemeshow拟合优度检验

HL优度检验结果说明,利用建模集数据得到的模型(2)能够较好地拟合检验数据集.根据建模数据集得到的风险系数门槛值r1=0.06和r2= 0.33,检验集中低风险等级样本中实际患有代谢综合征的频率为0.9%,中等风险等级样本中实际患有代谢综合征的频率为15.8%,而高风险等级样本中实际患有代谢综合征的频率等于50%,即高风险等级人群实际代谢综合征患病率是低风险等级样本的59倍.由此可见,这样得到的低、中、高3个风险等级的人群在是否患有代谢综合征方面的确存在很大的差异.

6.3进一步说明

我们建立了一个针对中老年人群的有着3个风险等级的代谢综合征识别模型.事实上,保险公司可以在利用以往投保和理赔数据的基础上构建等级数目更多、考虑因素更充分、适用人群更广泛的风险识别模型.此外,还可以考虑将这种构建模型的方式用于其他类型的风险.对于代谢综合征,如果保险公司能在客户投保时获取被保险人的年龄、体重、身高、腰围、家族病史等基本信息,并实现对每一位被保险人确定一个风险系数,再将其与利用经验数据定义的风险等级系数门槛值进行比较,就可以对每一位被保险人是否患有代谢综合征进行初步估计,从而采取不同的核保措施,以达到更好地识别或区分个体风险水平的目的.

本文使用的Logistic回归模型中出现了两个肥胖指标,如果投保信息不充分,例如不能获得腰围的信息,也可以只使用BM I这一个指标,当然也就需要重新建立模型并重新确定对是否患有代谢综合征有显著影响的自变量.

需要说明的是本次使用的是中华医学会糖尿病分会提出的代谢综合征诊断标准.事实上,也可以在其他标准的基础上类似地完成风险分级的工作.此外,本项研究仅基于对一个社区的调查样本,且接受调查的对象有一定的选择性,如果能在更大人群中进行无选择性的调查,那么相关研究结果将更有把握被推广应用.

参考文献

[1]顾东风,Reynolds K,杨文杰等.中国成年人代谢综合征的患病率.中华糖尿病杂志,2005,13(3):181-186.

[2]周正元,孙国祥,吴国强等.代谢综合征相关危险因素分析.上海预防医学杂志,2006,18(2):62-63.

[3]李洋.肥胖的重新定义和处理.上海预防医学杂志,2001,13(4):161-162.

[4]郑祖康,张秀凤,陈汉元.富裕性疾病的相关分析.第二届海峡两岸统计与概率学术研讨会论文,苏州,1999.

[5]庞华英,尚汉冀,朱宝宽.关于中国人肥胖标准的探讨.2000

年国际减肥大会论文,北京,2000.

[6]Ko GT,Cockram CS,Chow CC,et al.,Metabolic syndrome by the international diabetes federation definition in Hong Kong.Chinese Diabetes Res Clin Pract,2006,7,73(1): 58-64.

[7]Frood ES,GilesWH.A comparison of the prevalence of themetabolic syndrome using two proposed definitions.Diabetes Care,2003,26: 575-581.

[8]Pinkham CA,Marianne E,Minuk H.The metabolic syndrome and all-cause mortality in an insured lives population.North American Actuarial Journal,2006,10(3): 7-16.

[9]Choi,KM,Lee J,Kim B.Factor analysis of themetabolic syndrome among elderly Koreans-the south-west Seoul study.Diabetic Medicine,2003,20: 99-104.

注:本文作者为复旦大学数学科学学院博士后流动站王奕渲博士,数学科学学院李荣敏副教授及研究生陆振华,第二军医大学中医系朱德增教授,上海市延吉社区卫生服务中心夏正常院长.

附录 延吉社区代谢综合征调查表

姓名________出生年月________

性别 A男 B女

现在住址________新村________(路)________号(弄)________室

电话________家庭人均收入________元/月

1 您是否参加过1997—1998年的富裕性疾病调查并填写过表格?  A是 B否

2 婚姻 A未婚 B已婚 C离异 D丧偶

3 文化程度 A未上学 B小学 C初中 D高中、中专 E大专以上

4 职业 A工人 B管理人员 C商业、服务业人员、个体经营者 D科教文卫人员 E下岗、待业 F离退休人员 G学生H其他

5 工作劳动强度 A极轻劳动 B轻劳动 C中等劳动 D重劳动 E极重劳动

6 休闲活动 A无 B散步、慢跑等 C骑自行车、游泳、跳绳等 D打羽毛球、乒乓球等 E太极拳瑜伽健美操等(可多选)

7 休闲活动时间 A小于30分钟 B30—60分钟 C大于60分钟

8 每周休闲活动次数 A少于3次 B3—5次 C6—7次

9 您是否饮酒?  A是(____年)  B否 C已戒酒____(年)

10 饮酒的种类 A白酒 B葡萄酒 C黄酒 D啤酒

11 每次饮酒量(白酒、葡萄酒、黄酒) A少于2两 B3—5两 C6两—1斤 D大于1斤

(啤酒)A 1瓶 B 2—3瓶 C多于3瓶

12 每周饮酒次数 A少于3次 B 3—7次 C多于7次

13 您是否吸烟 A是(____年)  B否 C已戒烟(____年)

14 每天吸烟量 A少于10支 B 10—20支 C多于20支

15 每天的主食量 A少于3两 B 3—9两 C 1—1.5斤 D大于1.5斤

16 平均每天吃多少含蛋白质较多的食物,如肉类、鱼类、豆类、蛋类 A少于3两 B 3—5两 C 6—9两 D大于1斤

17 平均每天吃多少新鲜蔬菜?  A少于5两 B 5—9两 C 1—2斤 D大于2斤

18 平均每天吃多少新鲜水果?  A少于5两 B 5—9两 C 1—1.5斤 D大于1.5斤

19 平均每周喝几次牛奶?  A不喝 B少于3次 C 3—7次 D大于7次

20 平均每周吃多少含脂肪多的食物,如肥肉、内脏等 A少于3两 B 3—9两 C 1—2斤 D多于2斤

21 糖尿病史 A无 B有________年

22 您是否接受治疗 A控制膳食 B运动锻炼 C降糖药 D胰岛素 E中药(可多选)

23 最近的血糖水平________mmol/L

24 您家族中是否有患糖尿病的成员 A否 B父母 C儿女 D兄妹 E祖父母 F外祖父母

25 高血压病史 A无 B有________年

26 您是否接受治疗 A控制膳食 B运动锻炼 C降血压药 D中药(可多选)

27 最近的血压水平  收缩压________(mmHg)舒张压________(mmHg)

28 您家族中是否有患高血压病的成员 A否 B父母 C儿女 D兄妹 E祖父母 F外祖父母

29 高血脂史 A无 B有年

30 您是否接受治疗 A控制膳食 B运动锻炼 C降血脂药 D中药(可多选)

31 最近的血脂是否高 A无 B有

32 您家族中是否有血脂高的成员 A否 B父母 C儿女 D兄妹 E祖父母 F外祖父母

33 肥胖史 A无 B有________年

34 您家族中是否有肥胖的成员 A否 B父母 C儿女 D兄妹 E祖父母 F外祖父母

35 您是否发生过或有以下情况 A缺血性卒中 B脑出血 C短暂性脑缺血发作(TIA)  D心肌梗死 E心绞痛 F冠心病 G慢性肾病 H眼底病变 I其他病变

36 体重________(kg) 身高________(cm)

37 腰围________(cm) 臀围________(cm)

38 收缩压________(mmHg) 舒张压________(mmHg)

39 空腹血糖________mmol/L

40 总胆固醇________mmol/L 甘油三酯________mmol/L LDLC________mmol/L HDLC________mmol/L

41 填表日期________年________月________日

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈