您的位置:健客网 > 糖尿病频道 > 糖尿病关注 > 科研成果 > 发病风险模型的发展及其在糖尿病领域中的应用

发病风险模型的发展及其在糖尿病领域中的应用

2017-04-26 来源:中华糖尿病杂志  标签: 掌上医生 喝茶减肥 一天瘦一斤 安全减肥 cps联盟 美容护肤
摘要:尽管国内外已经构建了多个糖尿病发病风险预测模型,但目前尚无一个类似于Framingham心血管病风险评分一样广泛推广应用的评分系统或风险预测模型

  随着老龄化和生活方式的改变,慢性病已经逐渐成为影响人类健康和生活质量的重要问题[1]。因此,构建疾病的发病风险预测模型,并根据预测模型计算出具有某类特征的个体疾病的发病概率,对于降低慢性病发病率、减轻疾病负担有重要的意义。疾病的发病风险预测模型早期主要应用于心血管疾病[2],近年来,在恶性肿瘤、糖尿病、高血压、代谢综合征、血脂紊乱、慢性肾脏病等主要慢性病方面有飞速的发展[3,4,5]。伴随着计算机的飞速进步,各类统计软件的广泛普及,疾病的发病与死亡风险预测模型也进入了快速发展时期[6]。从早期的Logistic回归模型、Cox比例风险模型,逐渐发展了包括时间序列模型[7]、灰色模型[8]、神经网络模型[9]、支持向量机模型[10]等多种方法与模型。下面对这些模型进行简要介绍。

  一、风险预测模型的方法与进展

  1.Logistic回归模型与Cox比例风险模型:

  回归模型是早期发展起来的统计方法,并应用于疾病发病风险预测中。包括线性回归、Logistic回归等。其中后者的因变量是二分类变量,即0、1变量,与疾病患病结局的分类状态相吻合,因此得到了广泛的应用。常采用比值比作为描述某因素致疾病发病风险的指标[11]。

  Cox比例风险模型适用于含有时间变量的队列数据,且相对于Weibull函数,Cox模型对数据的分布情况没有要求,是基于非参数检验的方法。其主要的效应指标为相对危险度[12]。

  2.灰色模型:

  灰色模型是20世纪80年代由华中科技大学的邓聚龙教授提出的。它的基本原理是将无规律的原始数据通过多次数据处理转化为有规律的序列,再通过微分方程等构建动态模型。该方法适用性好且预测效能强,广泛应用于多种类型疾病的流行趋势[13,14]。

  3.神经网络模型:

  也称为人工神经网络(artificial neural network,ANN),它是将生物神经网络的结构和工作原理用数学形式模拟出来,使其具有人脑的某些功能。ANN属于非线性模拟系统,对资料特性基本没有特殊要求,能拟合任意非线性关系,且能较好地处理缺失变量信息,具有学习和自适应能力。但由于仍处于起步阶段,仍有一些缺陷,如模型结构选取、训练方式以及训练时间等需要改进[15]。

  4.支持向量机模型:

  支持向量机是1995年由统计学家提出的,其基础原理是结构风险最小化。它根据有限的样本信息,在特定训练样本的学习精度和无错误地识别任意样本之间寻求最佳折中,并获得最好的推广能力。支持向量机模型的分类函数与神经网络较为类似,并在解决小样本、非线性及高维模式识别中有较好的优势[16]。

  上述介绍了几种常用的风险预测模型,各有优缺点,且随着计算机的发展和大数据时代的到来,将不断有新颖的模型出现,如近年来一些专家提出的基于多种模型方法的组合模型[17]。这将有益于我们更加精准地预测疾病的发病风险,指导人群的早期防控。

  二、国内外糖尿病发病风险预测模型汇总及比较

  近年来国内外研发了多个糖尿病的发病预测模型。2011年英国医学杂志发表了糖尿病发病风险模型的系统综述,最终纳入了43个研究中提出的94个糖尿病发病风险评估模型[18]。作者在此基础上,结合近几年的研究进展,筛选其中推广应用较为广泛的发病风险模型进行了汇总,见表1。

  从表1中可以看出,大部分的风险预测模型建立在队列研究的数据基础上,随访时间为5~10年,随访人群从千余人到百万余人。纳入的指标主要包括下面几类:(1)人口社会学基本特征:性别、年龄、民族、种族、经济水平、文化程度;(2)生活方式相关指标:吸烟、饮酒、体育锻炼、咖啡、膳食(红肉、蔬菜、水果、谷类主食等);(3)身体测量指标:身高、腰围、体质指数(BMI)、收缩压;(4)化验检测指标:空腹血糖、甘油三酯、高密度脂蛋白胆固醇(HDL-C)等;(5)既往慢性病史,包括高血糖、高血压、血脂紊乱、心脑血管疾病等;(6)治疗和服药情况:类固醇类药物、降压药、降脂药;(7)遗传因素:糖尿病家族史、基因多态性位点、遗传风险评分[37]等。可以看出,部分预测模型仅纳入了几个简单人口社会学和测量变量,而大部分发病预测模型包含了血压化验检测指标在内。近年来有些模型使用了包括基因多态性位点、遗传风险评分等遗传因素在内。但2013年发表在Diabetes Care上的一篇研究指出,遗传因素尤其是遗传位点的信息,虽然花费较多,但并没有使得模型预测能力得到显著地提升[37]。

  另一方面,可以看出,尽管上述提到了多种疾病的发病预测模型,但目前为止在慢性病领域中应用较为广泛的仍是前面几类,如Logistic回归模型、Cox比例风险模型。近年来,部分糖尿病研究使用了神经网络和支持向量机[38]等模型。且有些研究同时使用多种统计模型,比较不同统计模型的预测能力。可以看出,使用神经网络和支持向量机等新的模型,其预测能力有所提高。

  三、糖尿病发病风险预测模型的应用

  糖尿病发病风险模型主要应用是筛查高危人群,早期开展防治措施。另一方面,也要能正确区分糖尿病的低危人群,防止错分而增加服药或医疗负担。即发病风险模型在一般人群中应用时要有好的区分度[39]。目前大多数的糖尿病风险预测模型,在构建时即建立了验证队列,对所构建的模型预测能力进行验证。但绝大部分是内部人群的验证。少数的几个发病模型,在不同的人群中进行了验证,且模型区分能力较好。例如芬兰糖尿病风险评分问卷不仅在芬兰,还在丹麦、瑞士、英国、澳大利亚、中国等多个国家进行了推广应用,结果显示区分效果良好,外部验证的曲线下面积达到了0.76[40,41,42,43]。此外,澳大利亚风险评估工具(Ausdrisk)在悉尼开展的基于1 550人的糖尿病防治项目研究中起到了重要的作用。通过Ausdrisk筛选出来的糖尿病高危人群,进行生活方式的干预和健康管理,经过12个月的随访,取得了良好的效果[44]。

  模型的推广和应用还受到其组成变量的限制。从公共卫生学和可行性角度考虑,若模型中含有一些侵入性测量变量,如HDL-C、甘油三酯、空腹血糖、甚至于基因位点等,其推广则容易受到限制,尤其在一般人群中进行糖尿病发病风险筛查[38]。仅含有一般变量如人口社会学特征、生活方式、身体测量指标如身高、腰围等构建的发病风险模型,相对而言更容易在一般人群的普及。另一方面,人口社会学特征是无法改变的,如性别、年龄、种族,因此其对于改善个体的糖尿病风险模型没有作用。而不良生活方式、高BMI和腰围等,则是可以改善的指标,在经过个体改变生活方式或减肥等措施后,能够降低糖尿病风险。目前我国糖尿病防治指南中推广应用的糖尿病风险评分表中主要是简单的变量,包括人口社会学特征、BMI、腰围、血压和糖尿病家族史,适合在人群中广泛推广,用于糖尿病的人群筛查[34]。此外,芬兰糖尿病风险评分在我国应用也较为广泛,多个研究证实,其不仅快速、非侵入性,且预测能力较好[45,46]。

  四、展望

  尽管国内外已经构建了多个糖尿病发病风险预测模型,但目前尚无一个类似于Framingham心血管病风险评分一样广泛推广应用的评分系统或风险预测模型[47]。这些已经构建的模型各有优劣,且预测能力各有高低,适用人群和种族也不尽一致。因此,在糖尿病的发病风险模型预测的研究,要逐渐从建立模型转变到模型的人群应用检验,找出在人群风险预测和外部推广性最优的模型。另一方面,基于我国人群的大样本长时间的队列数据构建的发病风险模型较少,大多数是基于横断面研究或人数较少的小样本研究。流行病学家和临床医师应结合起来,积累我国人群的糖尿病大队列数据并构建符合国情的发病模型,以便克服外来模型的种族不适宜性,并开展外部推广应用。

看本篇文章的人在健客购买了以下产品 更多>
有健康问题?医生在线免费帮您解答!去提问>>
健客微信
健客药房
手机糖宝