翻译分享自:Chest. 2020 May;157(5):1147-1157. doi: 10.1016/j.chest.2019.11.039. Epub 2019 Dec 28.
慢性阻塞性肺病是一种异质性综合征。许多COPD亚型已被提出,但是对于有多少COPD亚型以及定义还没有达成共识。本文我们根据COPDGene中最相关子分型论文所涉及的问题进行了综述。
所谓机器学习是指从经验(数据)中自动“学习”以完成特定任务的计算算法的设计、开发和分析。
1
如何用聚类方法来发现新的亚型,
这些亚型是否具有重复性?
在342名因呼吸恶化住院的COPD受试者中,确定了3个组群,其中2个组群与以气道表现为主的COPD和严重气流受限及肺气肿组相似[1]。在另一项从门诊诊所招募的415名COPD患者的研究中也得出类似结论[2]。在关于COPD聚类研究的唯一系统综述中,Pinto等人发现了2个反复出现的分组,似乎与以气道表现为主的COPD和严重气流受限及肺气肿分组具有相同的特征[3]。然而,Pinto等人也注意到,由于研究中使用的方法和变量不同,无法对聚类结果进行定量比较,因此无法对聚类结果的可重复性进行定量评估。
2
还有哪些机器学习方法
可以用来研究COPD的异质性?
作为疾病轴比集群更具重复性这一发现的延伸,Kinney等人将另一种降维方法——因子分析,应用于COPDGene的28项胸部CT和肺功能测量中,以识别COPD疾病轴[4]。肺功能测量对前2个因素有很大的贡献:第一个是基于多个肺气肿测量CT的贡献被标记为肺气肿疾病轴;第二个是由于CT测量的节段性气道壁厚度的贡献被标记为气道疾病轴。还确定了其他3个因素:2个代表气体捕获和过度通气,1个代表与BMI相关CT测量的可变性。然后将这些因素纳入COPD病死率和临床结果的预测模型。气道和肺气肿疾病轴均与死亡率相关,具有统计学意义,气道和肺气肿疾病轴之间存在协同作用(图1)。
图1 在Cox比例风险模型中,Z轴代表全因死亡率的预测概率,范围从4%(深蓝色)、5%~10%(紫色)、10%~15%(蓝色)、15%~20%(绿色)、20%~25%(橙色)、25%~30%(黄色)、30%~35%(红色)到> 35%(深红色),因子1(肺气肿轴)和因子2(气道轴)的每十分之一负荷得分,已对年龄、性别、吸烟及包年、体重指数、高血压、五因素、因素1与因素2之间的相互作用和因素2的二次项进行校正。X轴和Y轴表示每个轴的十分位,范围从表示小负载分数1到表示大负载分数10。
3
如何以数据驱动的方式定义切点,
将COPD连续测量转化为亚型?
Yun等人通过研究外周血嗜酸性粒细胞值与COPD加重风险之间的关系来解决这个问题[5]。在COPDGene研究的GOLD2、3、4分期中,呼吸恶化的数量与外周血中嗜酸性粒细胞计数呈线性相关,与嗜酸性粒细胞绝对值的相关更强。该研究还发现,与嗜酸性粒细胞百分比相比,嗜酸性粒细胞绝对值能更好地预测呼吸系统恶化[6]。Yun等人的研究为依据基于COPD相关结果风险评估标准将COPD持续表型转化为临床相关亚型提供了路径(纳入受试者为外周血嗜酸性粒细胞增多)。
4
胸部CT数据的机器学习
如何提高我们描述COPD异质性的能力?
Mendoza等人通过将局部肺密度直方图与一组超过9 000次COPD CT扫描中手动选择的病理性肺气肿参考模式进行比较,使用k近邻算法(KNN)来量化不同的肺气肿模式。最终得到的局部直方图肺气肿量化与一系列肺活量和功能性指标的关联比标准的肺气肿CT指标更强,这些指标中的GWAS确定了已知的和新的遗传关联[7,8]。随后,使用CRISPR基因编辑技术显示了GWAS识别的一个基因区域,该区域包含一种纤维母细胞特异性增强子元素,可以增加成纤维细胞中TGF-β2的表达,为COPD中肺气肿与TGF-β信号之间的联系提供额外的遗传学证据[9]。
5
是否存在与COPD分子亚型
相对应的不同肺功能轨迹?
Ross等人开发了一种Bayesian建模方法,将疾病轨迹的概念合并到COPD亚型识别中[10]。Lange等人使用了规范老龄化研究(NAS)中长达数十年的纵向肺活量数据来识别和模拟4种不同的FEV1下降模式。有趣的是,在中年时下降速度最快的轨迹,其FEV1最大值最低,提示这是一个低肺生长/快速下降的轨迹(图2)。在COPDGene中,重度COPD患者在低生长/快速下降轨道中比例过高。
图2 对1 060名男性进行20年以上的正常老化研究,获得4条肺功能轨迹。轨迹1的特点是中年时肺功能丧失的速度更快,其FEV1最大值较低。其他轨迹的差异主要见于FEV1最大值,而不是下降率[11]。
6
方法学精粹
1.聚类分析对COPD亚型的探索性分析最有用;
2.连续性疾病轴比聚集性疾病轴更能准确代表COPD的异质性;
3.通过机器学习算法获得的胸部CT表型提高了量化COPD异质性的能力,并导致新的生物学发现,包括TGF-β通路;
4.肺的生长和衰退轨迹显示出很强的遗传影响,可能使COPD有更强有力的生物学发现。
7
预期COPDGene在关键领域
有哪些额外的贡献?
首先,当10年的随访数据可用时,疾病进展的相关性将更明显,更详细的肺功能轨迹描述将成为可能。第二,在5年和10年的随访中,从血液样本中大规模产生的DNA测序、RNA测序、DNA甲基化和蛋白质组数据将确定COPD进展的关键分子生物标志物,从而改进COPD分子亚型的定义。第三,对疾病进展的最新分析可以确定准确风险分层所需的最小变量集,使亚型在临床环境中得到更广泛地应用。最后,机器学习方法的进步可能会使人们更详细地了解COPD异质性与疾病进展之间的关系。
参考文献
[1] Garcia-Aymerich J, Gómez FP, Benet M, et al. Identification and prospective
validation of clinically relevant chronic obstructive pulmonary disease (COPD) subtypes. Thorax 2011;66(5):430-437
[2] Pistolesi M, Camiciottoli G, Paoletti M, et al. Identification of a predominant COPD phenotype in clinical practice. Respiratory Medicine 2008;102(3):367-376
[3] Pinto LM, Alghamdi M, Benedetti A, et al. Derivation and validation of clinical phenotypes for COPD: a systematic review. Respiratory Research 2015;16(1):50
[4]Kinney GL, Santorico SA, Young KA, et al. Identification of Chronic Obstructive Pulmonary Disease Axes That Predict All-Cause Mortality: The COPDGene Study. Am J Epidemiol 2018;187(10):2109-2116
[5]Yun JH, Lamb A, Chase R, et al. Blood eosinophil count thresholds and exacerbations in patients with chronic obstructive pulmonary disease. J Allergy Clin Immunol 2018;141(6):2037-2047.e10
[6]Vedel-Krogh S, Nielsen SF, Lange P, et al. Blood Eosinophils and Exacerbations in Chronic Obstructive Pulmonary Disease. The Copenhagen General Population Study.
Am J Respir Crit Care Med 2016;193(9):965-974
[7] Castaldi PJ, San José Estépar R, Mendoza CS, et al. Distinct Quantitative CT
Emphysema Patterns are Associated with Physiology and Function in Smokers. Am J Respir Crit Care Med 2013;188(9):1083-1090
[8] Castaldi PJ, Cho M, San José Estépar R, et al. Genome-wide association identifies regulatory Loci associated with distinct local histogram emphysema patterns. Am J Respir Crit Care Med 2014;190(4):399-409
[9] Parker MM, Hao Y, Guo F, et al. Identification of an emphysema-associated genetic variant near TGFB2 with regulatory effects in lung fibroblasts. Elife 2019;8
[10] Ross JC, Castaldi PJ, Cho M, et al. A Bayesian Nonparametric Model for Disease Subtyping: Application to Emphysema Phenotypes. IEEE Trans Med Imaging 2017;36(1):343-354
[11]Lange P, Celli B,Agustí A,et al. Lung-Function Trajectories Leading to Chronic Obstructive Pulmonary Disease. N Engl J Med 2015;373(2):111–122
本 期 作 者
孟爱宏 主任医师
医学博士、教授、博士生导师
河北医科大学第二医院呼吸与危重症三科主任
张欣玲 医师
河北医科大学第二医院2019级研究生
本文仅代表作者个人观点
仅供医务人员参考
编辑 王文熙 | 责编 梁文华、杨子峰
订阅后可查看全文(剩余80%)