慢性呼吸系统疾病的遗传学研究值得关注:基因变异与肺功能相关特征的联系?遗传信息如何帮助评估风险?
来源: 呼吸界 08-17


编前语


遗传学(基因组学)作为理解疾病机制的重要方法,正在推动呼吸系统疾病研究的深入发展。随着大规模遗传学研究的推进,呼吸界和医学界对慢阻肺病、哮喘、间质性肺疾病等呼吸系统疾病的遗传基础有了更深入的理解。

随着多组学技术、人工智能技术及数据处理技术的不断更新迭代,不同技术之间的协作也大幅度提升了我们对呼吸疾病的认识。这些技术进步为早期干预、精准识别疾病亚型以及靶向治疗提供了坚实的理论依据,标志着在应对呼吸系统疾病方面进入了一个全新的阶段。

基于此,Nature Review特别邀请来自英国NIHR Nottingham 生物医学研究中心的Ian Sayers等教授针对慢性呼吸系统疾病的遗传学研究现状进行了系统综述,详细介绍了这些疾病的遗传基础。重点探讨了全基因组关联研究(GWAS)在识别与这些疾病相关的基因变异中的重要作用,并分析了基因-环境相互作用及其在疾病发病机制中的影响。

为了帮助广大呼吸领域的同道更好地理解这一前沿领域的进展,因此,我们组织进行了编译和解读,希望能为国内呼吸界同行开展呼吸系统疾病的遗传学研究与临床转化提供有益的参考和借鉴。




要点提示

1、慢性呼吸系统疾病,包括慢性阻塞性肺疾病(简称慢阻肺病,COPD)、支气管哮喘和间质性肺疾病(ILD)等,是常见的多基因疾病,发病率及死亡率高,显著增加了全球的疾病负担。

2、大规模的遗传流行病学研究发现某些特定基因变异与各种呼吸系统疾病之间存在关联,并将这些基因变异与肺功能的相关特征联系起来。这些发现加深了我们对常见呼吸系统疾病遗传基础和机制的理解。

3、研究不同呼吸系统疾病的基因关联重叠,以及基因与环境相互作用的证据,进一步揭示了疾病发病相关的分子途径。这些遗传信息可以帮助评估呼吸系统疾病的风险,并为个性化治疗方案提供重要的依据。


背景资料


慢性阻塞性肺疾病(简称慢阻肺病,COPD)、支气管哮喘和间质性肺疾病(ILD)等常见慢性呼吸系统疾病是全球第三大死亡原因,占2017年全球死亡率的7%。在英国,大约有1200万人患有呼吸系统疾病,英国国家医疗服务体系(NHS)每年在呼吸系统疾病的费用约为110亿英镑。在美国,2016年与呼吸系统疾病相关的成本估计约为1710亿美元。慢阻肺病和哮喘是最常见的呼吸系统疾病,随着治疗方法的进步,像特发性肺纤维化(IPF)这样的间质性肺疾病也越来越多地被转诊至上级医疗机构。


多年来,慢阻肺病和哮喘等疾病主要被认为是由环境因素引起的,例如吸烟或暴露于环境污染物。遗传度评估表明,遗传因素在慢性呼吸系统疾病的发病风险中起到了重要作用。在过去的 15 年里,由心脏和衰老基因组流行病学研究队列(CHARGE)、国际慢阻肺病遗传学联盟(ICGC)、跨国哮喘遗传学联盟(TAGC)和 SpiroMeta 等倡议推动的大规模的研究,加速了我们对常见肺部疾病遗传基础的了解。英国生物银行等基于人群的研究,以及越来越多的专病队列研究,也为这些发现提供了重要支持。大多数确定慢性肺部疾病遗传机制研究都采用了全基因组关联研究(GWAS)(表1)。


来自具有呼吸表型信息的全外显子组和全基因组测序数据可能提供额外的价值,特别是在识别罕见变异的贡献方面。另外,新的转录组和蛋白质组数据集正在帮助我们了解这些关联背后的因果变异产生的功能效应(图1)。


表1 关键呼吸性状的遗传力评估和GWAS研究总结


a摘自NHGRI-EBI GWAS目录(https://www.ebi.ac.uk/gwas/;2023年12月22日访问)。b NHGRI-EBI GWAS目录中未描述哮喘-COPD重叠,因此数据由作者整理. cNHGRI-EBI GWAS目录结合了间质性肺疾病。COPD,慢阻肺病;FEV1,第一秒用力呼气容积;FVC,用力肺活量;IPF,特发性肺纤维化。


图1 | 变异到基因的映射工作流程。

a、全基因组关联研究(GWAS)用于识别基因型与呼吸表型之间的关联。这些研究使用疾病状态作为二元性状,或使用第一秒用力呼气容积(FEV1)、用力肺活量(FVC)、峰流速和FEV1/FVC比率等数量性状的肺功能变量。

b、通过包括贝叶斯方法在内的精细定位方法进一步细化这些基因关联。接下来,确定因果变异的位置可以提供更多的机制洞察,尽管大多数假定的因果单核苷酸多态性(SNP)位于非编码区域,需要特定方法来解决其功能问题。

c、在识别了哨兵(主要可信)变异后,通过使用一系列组学和连锁不平衡(LD)评分回归方法来研究相关基因。越来越多的表达和蛋白质数量性状位点(eQTL和pQTL)数据集可以帮助识别因表达改变而对特定基因关联产生贡献的基因。其他方法包括在全外显子组测序数据中(例如在UK Biobank中)搜索附近的罕见变异,优先考虑已知具有呼吸表型的孟德尔遗传相关基因,以及考虑小鼠基因敲除模型中的数据以寻找具有潜在感兴趣基因的呼吸表型。

多基因优先评分(PoPS)是一种基因优先化方法,利用GWAS汇总统计数据,并结合来自整体和单细胞表达数据集、整理的生物通路和预测的蛋白质-蛋白质相互作用的数据。最后,可以通过将识别的可能驱动效应的基因进行分组并使用全表型组关联研究(PheWAS)方法探索其他表型,进一步研究生物机制。

U,潜在混杂因素;WES,全外显子组测序;WGS,全基因组测序;FDR,假发现率;bp,碱基对。


目前,许多针对常见呼吸系统疾病患者的药物主要用于控制症状,而不是直接改变疾病过程。更好地理解慢性肺病的遗传基础和受影响的分子途径将有助于开发新型治疗方法。这些进展可能有助于识别罹患呼吸系统疾病风险较高的群体,以及可能对特定治疗反应更好的患者亚群,从而促进早期干预。事实上,具有支持遗传信息的疾病的药物靶标更有可能成为治疗药物。


本综述涵盖了常见呼吸系统疾病和与肺功能有关的定量特征的遗传关联研究现状。内容主要涵盖以下几个方面:

(1)探讨了如何定义与肺功能相关的定量性状的遗传贡献,从而深入了解常见的呼吸系统疾病。

(2)回顾了针对慢阻肺病、哮喘和间质性肺疾病的疾病特异性GWAS的研究,并讨论了这些呼吸系统疾病的遗传关联之间重叠的程度和影响,以及基因-环境相互作用的证据。

(3)遗传信息如何为呼吸系统疾病风险评估提供支持并有助于分层治疗方法。


本综述并不包括罕见的呼吸系统疾病、肺血管疾病或单基因遗传疾病(例如囊性纤维化),或各种肺癌的遗传基础。


第一部分:基于肺功能特征的定量遗传学


与评估二分类性状的研究相比,GWAS使用定量性状提高了识别遗传关联的统计能力。2010 年之前,主要通过候选基因研究来调查与肺功能特征和/或疾病风险之间可能的遗传关联。然而,这些发现通常尚未使用 GWAS 方法进行验证。


1. 用肺量计测量肺功能


肺功能主要使用肺活量测定法进行测试,该方法测量用力呼吸时呼出的空气总量,称为用力肺活量(FVC),以及用力第一秒内呼出的气量,称为第一秒用力呼气容积(FEV1)。人们可以量化其他相关参数,例如 FEV1/FVC 比值和呼气峰流速(PEFR),这些参数也可以用作定量性状(图2)。


相对于健康的肺,FEV1/FVC比率的降低表明气流受阻,这是慢阻肺病和其他一些呼吸系统疾病的一个关键特征。FVC降低,而FEV1/FVC比率保持正常,表明肺功能受限,这可能是由于胸壁运动减少或肺实质疾病导致肺无法完全扩张。这种现象在临床实践中常见于间质性肺病,IPF是其中最常见的一种。最后,通常使用峰流速仪测量的PEFR降低表明气流受限,因此通常与FEV1一致。其他肺功能参数如气体交换的测量更为耗时,因此在大规模人口研究中通常不进行评估,导致可用于数量性状分析的数据较少。


图2 | 肺活量测定和肺功能性状

肺活量测定通过测量随时间推移呼出的空气量来提供定量的肺功能性状。由此曲线计算的关键指标捕捉了与健康肺(黑线)相比,由阻塞性肺疾病(蓝线)或限制性肺疾病(红线)引起的偏差。这些指标包括第一秒用力呼气容积(FEV1),这是用力呼气动作中一秒钟内从肺部排出的空气量;用力肺活量(FVC),即用力呼气动作期间从肺部排出的空气总量;FEV1/FVC比率;呼气峰值流速 (PEFR),即用力呼气操作期间记录的最大流速。


第二部分:不同遗传学研究方法在肺功能相关研究中的应用


1. 全基因组关联研究


2010年,SpiroMeta和CHARGE联盟首次对肺功能的GWAS进行了荟萃分析。随着样本量不断增加,这些早期研究的结果随后得到了进一步研究支持。最新的一项荟萃分析涵盖了580,869名参与者,鉴定出了1,020个独立的与肺功能相关的基因关联,这些功能指标包括第一秒用力呼气量(FEV1 )、用力肺活量(FVC)、FEV1/FVC比值和呼气峰流速(PEFR)(图1)。 这些基因关联通过一个系统的变异-基因映射框架得到了进一步的细化,最终关联到559个基因。 这些基因位于与基因表达调控相关的非编码区域,这些区域在肺病相关细胞中,如I型肺泡细胞、成肌纤维细胞、支气管上皮细胞以及成人和胎儿的完整肺组织中起着重要作用(图3)。


为了深入了解这些基因的作用机制,研究利用ConsensusPath DB(24)对这559个基因进行了生物路径和组织富集分析,发现了一些先前已知与肺功能相关的通路(如弹性纤维形成),以及一些首次在此研究中直接关联的通路(如PI3–Akt信号通路)。值得注意的是,这些基因关联不仅在老年人中出现,也在儿童和年轻人群中有所体现,暗示许多影响可能源自对肺发育重要的通路调控。这一发现与现有的流行病学证据一致,即在成年早期FEV1较低是慢阻肺病风险的重要因素。总体来看,NHGRI–EBI GWAS目录目前列出了3,691个与FEV1/FVC相关的基因关联(尽管并非所有关联都是独立的),这进一步强调了基因在决定肺功能中的重要作用。


GWAS方法还帮助确定了影响肺功能的遗传变异的效应大小。尽管许多常见的遗传位点都对肺功能的可变性有贡献,但单个遗传变异的效应通常较小。上述最新荟萃分析中识别出的1,020个基因关联总共解释了FEV1/FVC遗传力的33.0%(其中FEV1为21.3%,FVC为17.3%,PEF为21.4%)。


2. 全表型组关联研究


全表型组关联研究(PheWAS)探索给定遗传变异与多个表型之间的关联,进一步揭示了遗传变异对肺功能基础机制的贡献。特别是,PheWAS可以对单个或组合的SNP进行探索。PheWAS针对与肺功能性状相关的遗传变异发现了预期的与其他呼吸表型的强关联,尤其是与慢阻肺病相关的性状,但也发现了许多其他表型的关联。进一步的分析可以通过生成多基因风险评分(PRS),如果在针对性研究中使用少量或特定已知与感兴趣性状强关联的遗传变异时也称为遗传风险评分(GRS);这里为了保持一致使用PRS术语)。同一研究通过使用通路分区的SNP生成了PRS,表明肺功能变异(在特定通路中)与一系列其他表型相关。例如,特定于弹性纤维形成通路的较低FEV1/FVC比率的PRS与腹股沟、腹部、膈肌和股疝、憩室病、关节病、拇趾外翻和生殖器脱垂的风险增加相关,与腕管综合征和较低体重指数的风险降低相关。


3. 肺功能分析的局限性


在考虑肺功能分析时,有几个重要的局限性。


(1)几乎所有大规模人群基础的队列研究中测量的肺功能都没有进行支气管舒张试验。该测量需要评估气流受阻是否可逆。哮喘的特征是存在可逆的气流受阻,而不可逆的气流受阻是慢阻肺病的一个关键特征。这一局限性可能导致了目前缺乏专门评估可逆性气道阻塞的可复制遗传关联的研究,尽管一项针对慢阻肺病患者的研究发现了一些有提示性的关联。


(2)大多数研究仅在一段时间内测量肺功能,因此无法绘制影响肺生长或下降速度的遗传变异图谱。


(3)GWAS中使用的大多数队列缺乏多样化的人群种族。尽管人们正在努力增加非欧洲种族人群的数据,但这类样本量仍然较小,导致统计能力有限。增加GWAS中人群种族的多样性对于提高精细定位分辨率和开发适用于各种人群的新型治疗干预措施非常重要。


图3 | 肺功能GWAS识别出的关键基因和途径

识别出的基因根据器官功能进行分组。基因框的颜色表示满足支持使用该方法进行变异到基因映射的标准的数量。


第三部分:全基因组关联分析在不同慢性呼吸系统疾病遗传研究中的应用


除了应用肺功能作为GWAS分析的表型外,其他研究也将慢性呼吸系统疾病作为表型进行探索。


1. 慢阻肺病


慢阻肺病引起呼吸困难的原因主要是肺气肿或气流阻塞。当易感个体暴露于某些环境刺激时(特别是吸烟和较差的空气质量),就会引发慢阻肺病。截至2023年12月,NHGRI-EBI GWAS目录已经列出了113项不同研究中的1150个慢阻肺病易感基因(不同等级的证据支持)。探索慢阻肺病遗传关联的挑战之一,是在更广泛的表型研究和样本量之间平衡。一个综合性的慢阻肺病遗传学资源COPDGene,既考虑到了表型研究的广度,又兼顾了样本量。该资源包括10,198名个体的大规模队列,其中大多数人接受了计算机断层扫描(CT扫描)并进行了长期随访。


许多慢阻肺病和肺功能性状的易感基因是重叠的。因为FEV1/FVC比值小于0.7是诊断COPD的标准之一。因此,为肺功能开发的PRS对慢阻肺病具有很强的预测性。最新一项纳入多种族预测肺功能的PRS研究发现,最高风险十分位人群与最低风险十分位人群相比,慢阻肺病的风险增加了5.2倍。此外,通过慢阻肺病的GWAS研究,确定了多个基因和生物途径与使用FEV1/FVC比值或FEV,作为性状的研究所确定的基因和途径重叠。实际上,FEV1/FVC比值的PRS在使用PheWAS方法研究时,显示出与UK Biobank中的慢阻肺病表型的强关联性。其中,弹性纤维形成、PI3K–Akt信号传导、信号转导和肥厚性心肌病等通路都与慢阻肺病有关。


准确的慢阻肺病表型对于研究其全部遗传基础至关重要。例如,患者自报的慢阻肺病作为一种表型不太可靠,这可能解释了为什么使用电子健康记录定义的慢阻肺病与使用质量控制的肺活量测定数据定义的慢阻肺病相比,相关的遗传变异效应较小。另外,广泛的表型可以排除气流受限的其他原因(例如哮喘或支气管扩张),并允许对慢阻肺病的亚表型进行更详细地探索。


需要影像数据来区分慢阻肺病中的两种病理:气道炎症(导致气道狭窄,通常伴有慢性支气管炎和痰液增加)和气腔破坏(肺气肿)。为进一步探讨这一点,COPDGene进行了使用CT图像表型的GWAS,确定了五个与肺气肿相关表型易感基因位点,两个与气体潴留表型相关的易感基因位点和一个与气道表型相关的易感基因位点。这些位点包括先前已知的慢阻肺病易感基因,例如HHIP、15q25和AGER,以及SERPINA10和DLC1附近的新易感基因。然而,因为样本量和检测能力的限制,事实上可能存在更多的遗传关联基因或位点。


GWAS方法在识别慢阻肺病风险变异方面的优势,可以通过SERPINA1基因中的Z变异(rs28929474 T)得到很好地体现。早在70年前的观察研究就发现,携带Z等位基因的纯合子个体因α1-抗胰蛋白酶缺乏而更易患上慢阻肺病,这种缺乏会导致肺气肿。然而,尽管有研究表明,Z等位基因的杂合子个体也可能有更高的慢阻肺病风险,但传统的GWAS分析并未将SERPINA1识别为与肺功能或慢阻肺病相关的风险基因。


最新的PheWAS研究则解释了这一矛盾。研究发现,杂合子个体通常身材较高,因而肺功能较好,这在标准的显性遗传模型中有效抵消了Z等位基因对肺功能的负面影响。这一发现为进一步研究其他罕见变异的影响提供了重要线索,尤其是在慢阻肺病中,这些罕见变异可能解释了约36%的遗传度。


2. 哮喘


GWAS研究也明显增强了我们对哮喘遗传机制的理解。自2007年首个针对哮喘的GWAS研究发表以来,后续的研究逐渐扩大了检测的变异量和队列规模。NHGRI-EBI GWAS目录目前描述了194项将哮喘作为表型进行的GWAS研究。这些研究共识别了3291个易感基因。最大的一项研究是使用全球生物样本库进行的跨种族荟萃分析(包括153,763例病例和1,647,022例对照),识别了179个哮喘相关位点。后续分析表明,共有468个哮喘易感基因,且遗传分布在所有纳入研究的种族中大体一致。已明确的易感基因和途径涉及广泛的生物功能,包括炎症(IL4、IL13、IL33和HLA基因)、细胞激活(CD28)、转录因子(GATA3和STAT5)以及补体和固有受体(TLR1和TLR6)。气道结构和重塑机制也得到了体现,包括通过MUC5AC和蛋白酶维持上皮细胞稳态以及对细胞外基质调节的重要基因。


哮喘与慢阻肺病以及过敏性疾病(包括过敏性鼻炎和特应性皮炎)的遗传易感基因及位点存在一定重叠,表明这些疾病的遗传机制可能相同。另外,PheWAS研究表明,其他疾病——消化系统疾病、神经精神疾病、2型糖尿病和类风湿性关节炎——也与哮喘具有一定的遗传关联性。一个重大的进展是能够通过遗传信息预测哮喘。基于早期研究发现的哮喘遗传易感位点计算的多基因风险评分(PRS)来预测相关表型(如早发病、不可逆气流阻塞和住院情况),效果较差。


最近两项研究表明,随着识别出的哮喘遗传易感位点增多,哮喘PRS的预测能力有所提升。在第一项研究中,基于英国生物银行和跨国哮喘遗传学联盟(Trans-National Asthma Genetic Consortium)数据更新的哮喘PRS可以较好的预测哮喘,并且区分慢阻肺病。相比之下,尽管各队列之间存在较大异质性,基于肺功能表型数据获得的PRS则与哮喘和慢阻肺病均显著相关。在第二项研究中,基于全球生物银行荟萃分析获得的哮喘PRS对英国生物银行中的白人参与者的哮喘结果具有中等预测能力。正如预期,哮喘PRS的PheWAS发现最强相关的表型是哮喘相关特征,包括喘息、FEV1/FVC比值、花粉症/过敏性鼻炎或湿疹和嗜酸性粒细胞计数。


迄今为止最大规模的哮喘GWAS包括了所有可用的哮喘诊断数据。然而,一些研究通过细化数据集来解决临床表现中的异质性问题,特别是成人发病与儿童发病、中重度哮喘和哮喘加重。


总体而言,这些研究为特定哮喘亚型相关的遗传关联提供了一些支持性证据,但通常并未发现许多亚型特异性的新的遗传关联位点。例如,ORMDL3位点的变异已被证明与儿童发病哮喘更相关。最近的一项替代方法通过计算机识别22种共病模式并进行GWAS,最终识别出109个基因位点,包括亚组特异性位点。该方法为相关分子通路提供了更多的见解,例如参与气道炎症和T细胞活化的其他基因,以及在具有肌肉骨骼共病的哮喘亚组中发现的差异。


近期的研究工作推进了识别与哮喘易感性和疾病机制相关的遗传变异、基因和通路。这些研究促成了多种靶向特定基因和路径的生物疗法开发,包括IL5、IL33、IL1RL1、TSLP和IL4R(图4)。例如,基于罕见变异的研究发现了一个导致IL33剪接异常的罕见功能缺失变异,这种变异会生成一个截短的蛋白,从而降低哮喘风险,使IL-33成为一个可行的药物靶点。


进一步识别哮喘遗传基础的一个关键挑战是:缺乏针对临床或生物标志物定义的疾病亚组的大规模研究。这类研究对于减少异质性、更好地识别特定哮喘亚组的遗传驱动因素,并为患者提供更个性化的管理至关重要。


图4 | GWAS识别的哮喘中被靶向的基因和途径

在哮喘中,气道上皮细胞受到环境因素(如病毒或过敏原)的刺激,导致释放报警素如IL-25、IL-33和TSLP。这些报警素随后引发多种细胞类型(例如树突状细胞、嗜碱性粒细胞、ILC2和Th2细胞)的炎症反应,最终导致以高水平的IL-4、IL-5和IL-13为特征的2型炎症。

候选基因由GWAS识别出来,显示在红色框中,包括编码细胞因子(例如IL13、IL4、IL5和IL33)、细胞因子受体(例如IL1RL1,这是IL-33受体,和IL4RA)、信号分子(例如GATA3、RAD50和STAT6)和下游效应分子(例如MUC5AC,导致粘液生成)。

正在开发和/或临床实践中的靶向相应途径的生物疗法包括抗IL-13(lebrikizumab、tralokinumab)、抗IL-4/13(dupilumab)、抗IL-33(itepekimab)、抗IL1RL1(astogolimab)、抗TSLP(tezepelumab)、抗IL-5(mepolizumab、reslizumab)、抗IL-5R(benralizumab)和抗IgE(omalizumab)。


3. 哮喘和慢阻肺病的重叠


哮喘和慢阻肺病是不同的疾病,但在更严重或晚期阶段,它们共享多个临床和病理特征。研究估计哮喘和慢阻肺病之间的遗传相关性在0.38到0.50之间,最强的相关性是慢阻肺病与中重度哮喘之间,表明它们也有大量共享的遗传机制。然而,直到2016年,只有HLA区域的变异——编码人类白细胞抗原或主要组织相容性复合体(MHC)——被证明与欧洲人群中的哮喘和慢阻肺病或肺功能相关。第一个独立与哮喘和肺功能相关的非HLA信号位于LRP1和STAT6附近,可能与白细胞介素信号传导相关。随后,随着样本量的增加,越来越多的重叠位点被识别,包括ORMDL3附近的信号,这是哮喘GWAS中首次识别的位点。


现在已知哮喘和慢阻肺病或肺功能相关的基因有大量重叠(图5)。这些重叠基因涉及炎症途径,如细胞因子(例如IL1R1、IL1RL1、IL2RA、IL13和IL18R1)和参与细胞因子信号传导的转录因子(例如SMAD3和STAT6)。其他重叠基因涉及气道发育或重塑的途径,如上皮细胞功能(例如ORMDL3/GSDMA)、蛋白酶(例如ADAM19和ADAMTSL3)以及许多功能尚不明确的基因。


具有哮喘和慢阻肺病临床特征的个体有时被称为“哮喘-慢阻肺病重叠综合症”(ACO)。最初的ACO-GWAS没有识别出超过全基因组显著性阈值的变异,但这些GWAS可能受限于统计能力和ACO定义的不一致性。迄今为止最大的ACO GWAS识别了8个显著相关的位点,其中大多数之前已与哮喘、慢阻肺病或肺功能相关。一个变异是5号染色体上的一个间隔性SNP(在检测的个体中占1.5%),这是ACO特有的,但需要进一步验证。


总的来说,目前关于慢阻肺病和哮喘重叠的研究表明,两者之间存在一定的遗传效应重叠。一些变异主要影响哮喘,并在一定程度上与慢阻肺病相关,而另一些则主要影响慢阻肺病。为了更好地解析ACO的遗传基础,基于生物标志物的表型分析可能有助于解决定义不一致的问题。此外,当样本量不足以进行GWAS时,其他“组学”方法可能为识别因果基因提供额外的支持。


4. 间质性肺疾病


间质性肺疾病的GWAS主要集中在IPF。第一个IPF的GWAS研究于2008年在日本队列中开展。这项研究发现了TERT基因。该基因编码端粒酶逆转录酶,该酶的催化作用帮助端粒重复序列添加到染色体末端。


基于联盟和全球生物库的数据,IPF的GWAS规模已大幅增加。通过对家族性间质性肺疾病的研究,发现SPC和SFTPA2基因与间质性肺疾病的发病有关。截至目前,NHGRI–EBI的GWAS目录已有42项将 IPF作为研究对象的GWAS, 共识别出了210个遗传关联位点。迄今为止,最大的一项跨种族IPF的GWAS研究,入组11,160例病例和140万例对照,识别出了25个独立的IPF易感位点。同时,这项研究也再次证实了MUC5B基因与 IPF 发病有相关性。该基因的主要作用是参与调节气道粘蛋白。表达具有性别差异。尽管具体的病理机制有待发掘,但现有数据发现MUC5B启动子变异(rs35705950)会导致IPF发生风险增加三倍,这是目前已知的该疾病最大的遗传风险因素。该变异也会增加MUC5B基因的表达,同时也被证实与IPF的生存率相关。


间质性肺疾病的GWAS还涉及了与端粒生物学相关的基因(例如,TERT和RTEL1)、促纤维化信号基因(AKAP13和DSP)、有丝分裂纺锤体装配基因(KIF15和MAD1L1)以及mTOR信号通路基因(例如,DEPTOR)。尽管有这些发现,我们对其潜在生物学机制的理解仍然有限。关于IPF的其他发现包括:由临床招募的患者,比生物样本库中筛选的个体,遗传关联效应更大;多个研究之间存在显著的异质性;存在某些种族特异性的效应。


除了病例对照研究以外,也有部分研究探索 IPF 中的某些临床特征的遗传关联性。比如,一项纳入了1,329名个体的研究,对肺功能和气体交换的长期变化进行了GWAS分析,发现了PKN2的反义RNA基因(编码一种Rho和Rac效应蛋白)。同样,对1,878名个体的无移植生存分析发现了PCSK6基因,该基因被认为与细胞凋亡和癌症侵袭性有关。


最近,一项纳入2,180例病例和2,457例对照的全基因组测序研究,利用gene-based分析,识别了之前已知基因(包括TERT和RTEL1)中的几个功能缺失变异。根据这些发现,作者认为,罕见变异关联会增加IPF风险。目前评估IPF的SNP遗传率为32%。在最近的一项研究中,基于GWAS数据中获得的IPF的PRS显示,即使排除了已知IPF 易感基因MUC5B的信号,这一评分仍与IPF诊断相关。同时,这个PRS还与间质性肺异常和疾病进展相关。


在全面理解间质性肺疾病的遗传基础之前,仍有许多关键挑战亟待克服。展望未来,研究应侧重于扩大和多样化队列规模,以发现新的重要基因变异。同时,需要改进基于临床或生物标志物的病例定义,并将现有的基因和路径关联,转化为明确的早期干预靶点。


5. 在肺功能变异、哮喘、慢阻肺病和IPF中的基因重叠


鉴于大多数肺部疾病都会导致肺功能测量异常,因此与肺功能异常相关的基因变异与呼吸系统疾病风险相关的遗传变异有相当大的重叠。例如,由于FEV1/FVC比值降低是慢阻肺病的一个关键诊断标准,预期与FEV1/FVC比值降低相关的遗传变异与慢阻肺病之间会有重叠。然而,这种重叠可能并不总是被识别,因为在GWAS方法中,研究定量性状(FEV1/FVC)比研究离散性状(慢阻肺病)有更有优势。


综合来看,各种呼吸系统疾病中涉及的基因确实存在重叠(图5)。例如,上述部分提到的与肺功能变量、哮喘和慢阻肺病相关的变异位点之间的重叠就是一个很好的例子。在多个疾病性状中,MUC5AC和MUC5B区域的遗传关联可能是最明显的重叠,提示粘蛋白在气道病理中的关键作用。然而,这一位点在不同疾病中的信号并不相同,表明每种疾病中的基因变异对粘蛋白生物学的影响有所不同。这一例子提示,需要确认看似重叠的遗传关联是否是由相同或不同变异引起,通常需要通过共定位分析来确定。


对于肺功能性状和呼吸疾病之间重叠的遗传关联,一个关键问题是:肺功能改变是否会增加疾病风险,还是疾病会导致肺功能改变?例如,一个遗传变异可能通过改变正常口径气道的发育直接影响FEV1,这预计会增加慢阻肺病的风险。已发展为疾病的个体中相关的遗传变异可能影响组织重塑的程度,以至于携带这些变异的个体肺功能参数的降低程度更严重。现有的证据表明,第一种解释,至少对于慢阻肺病而言——肺功能异常增加疾病风险可能更好地解释了大部分现有的数据。这一解释还得到了以下观察结果的支持:许多与肺功能相关的遗传关联在不同年龄段都有表现,并且许多是涉及发育的重要基因,表明正常肺发育的遗传控制在后期生活中会增加疾病风险。


许多个体遗传变异似乎对多个性状产生影响,可能是由于某些分子通路通常在多种生理过程中发挥作用,如肺发育、肺部炎症和组织重塑。因此,识别不同性状中失调的共同通路可能为治疗干预提供更广泛的机会。


图5 | 涉及一种或多种呼吸性状的遗传位点圆形图

仅显示与至少一个表型相关的基因组区域。通过基于距离的方法定义呼吸性状之间重叠的遗传关联。具体而言,遗传关联的主信号变异体之间必须相距超过200万碱基对,才能被认为是独特的遗传位点。红色表示肺功能位点,蓝色表示慢阻肺病位点,橙色表示哮喘位点,绿色表示特发性肺纤维化(IPF)位点。颜色越深表示与更多呼吸性状相关的位点。

外圈标注的是与多个性状相关的基因;内圈显示的是仅与一个性状相关的基因。染色体6和17上的两个位点涉及大量基因(太多以至于无法在图中显示: 

151号位点基因涉及多个性状(AGER, HLA-B, HLA-DQA1, HLA-DQB1, ITPR3, MICA, SCUBE3);

151号位点基因仅涉及一个性状(HIST1H2BD, LOC401242, HCG4B, TRIM26, IER3, MIR6891, MICB, AIF1, HLA-DRB1, HLA-DPA1, HLA-DPB1, GRM4);

334号位点基因涉及多个性状(EFCAB5, GSDMA, GSDMB, KANSL1, LOC102724596, ORMDL3, SUZ12P1, THRA);

334号位点基因仅涉及一个性状(LRRC37B, ASIC2, SLFN5, LHX1, C17orf96, ERBB2, ZPBP2, PSMD3, SMARCE1, JUP, STAT5B, ATXN7L3, MAP3K14-AS1, MAP3K14, SPPL2C, CDC27, TBX21, ZNF652, LOC101927274)。为了清晰起见,基因组距离未按比例显示。


第四部分:呼吸系统疾病中的基因-环境相互作用


1. 吸烟


吸烟可能是呼吸疾病中研究最多的环境风险因素。已有研究确立了吸烟在慢阻肺病中起因果作用,并与哮喘的发作和加重以及包括IPF在内的间质性肺病有关。然而,并非所有吸烟者都会患上慢阻肺病,这强烈暗示吸烟与遗传因素的相互作用共同决定了疾病的结果。确实,最近对英国生物银行数据的分析显示,在那些遗传风险较高(通过多基因风险评分测量)的个体中,吸烟对肺功能的影响更为显著。同样重要的是,大量已知的遗传变异与烟草成瘾的风险相关,这些变异主要涉及中枢神经系统通路或尼古丁受体变异。


2. 环境污染


包括室内和室外空气污染也是呼吸疾病的主要风险因素。深入了解基因与空气污染的相互作用可能对全球公共健康产生重要影响。为了探讨这一问题,研究人员采用了全基因组和候选基因的方法,以加深对呼吸系统疾病中基因-环境相互作用的理解(表2)。


一些候选基因研究已经关注了哮喘-吸烟和哮喘-空气污染的相互作用,特别关注谷胱甘肽-S-转移酶家族的抗氧化作用。然而,谷胱甘肽-S-转移酶家族并不是全基因组层面相互作用研究的主要发现。相反,这类研究发现,在已知的肺功能和慢阻肺病风险位点如EGLN2和CHRNB4之间存在基因-吸烟相互作用效应。使用英国生物银行数据的研究还发现了基因-空气污染相互作用对肺功能等临床方面因素有重要影响,但这些需要在独立人群中进行验证。最后,最大的一项肺功能GWAS研究在1,020个遗传关联中发现了69个与吸烟有名义上关联证据的相互作用。在既往发现的最强的信号(如HTR4位点)中,该遗传变异对吸烟者肺功能测量值(FEV1)的作用比未吸烟者大76%。


这些观察结果表明,尽管确实存在基因-环境相互作用的例子,但遗传和环境对肺功能的影响也可以是加性而非协同(虽然需要更大的样本量来排除小的相互作用效应)。然而,迄今为止,我们的理解仍然有限,部分原因是目前可用的队列规模相对较小,导致统计能力不足以检测效应。研究人员还面临着辨别潜在有害化合物的组合、暴露程度、暴露时间和其他修饰因素的挑战。克服这一挑战可能需要超越单一暴露和单一疾病性状之间的遗传关联的方法,全面考虑暴露情况并结合其他“组学”数据。


表2 呼吸系统疾病中由全基因组交互分析得到的基因-环境效应

注:P < 0.05或Bonferroni校正等效值被视为验证证据。COPD,慢性阻塞性肺疾病;GRS,遗传风险评分;PM2.5,直径小于2.5微米的颗粒物;PM10,直径小于10微米的颗粒物。


孟德尔随机化研究也可以提供有关环境风险因素在发病机制中作用的证据。孟德尔随机化可以探索使用已知与特定环境暴露(例如烟草成瘾风险)相关的遗传变异作为“工具”,以估计该暴露对感兴趣结局的因果效应。已知与体重指数增加相关的遗传变异已被用来证明体重指数与哮喘之间的观察性关联可能是因果关系。随着组学数据量的增加,孟德尔随机化还可以利用预测蛋白水平的遗传变异提供有关特定蛋白在病因中的因果作用证据。具体而言,孟德尔随机化方法可以帮助区分是蛋白水平的改变导致了疾病风险的增加,还是疾病引起了蛋白质水平的改变。


孟德尔随机化依赖于关键假设:孟德尔随机化假设遗传变异仅通过暴露影响结果,而不是通过可替代的多效性。因此,在使用孟德尔随机化方法时,谨慎选择遗传变异并检测假设(如敏感性分析)至关重要。


第五部分:遗传检测在呼吸系统疾病临床实践和患者照护中的应用


1. 预防措施和早期干预


从呼吸系统疾病的GWAS中计算PRS,可用于识别可能受益于预防措施或早期干预的个体或人群。然而,尽管PRS具有合理的预测价值,但到目前为止,它们通常没有被纳入指南或临床路径。一个值得更多研究的选项是将PRS与其他已知风险因素结合起来,以提高预测的敏感性和特异性。例如,最近一项研究发现,将PRS与临床风险因素(年龄、性别和吸烟史)结合起来,与仅考虑临床风险因素的模型相比,改善了慢阻肺病的预测准确性。这个PRS还与 CT图像表型相关,包括气道壁面积百分比和肺气肿的定量及定性测量。这一PRS预测呼吸疾病风险的潜在能力体现在慢阻肺病风险评分最高的前十分位人群与每天吸烟约20支、持续50年的吸烟史人群在绝对风险上是等价的。这个PRS本身与吸烟史没有相关性,因此这些效应是叠加的。然而,鉴于我们除了戒烟外,没有任何疾病干预措施用于慢阻肺病,目前尚不清楚如何在现有的临床路径中使用PRS。


2. 个性化治疗


对呼吸系统疾病遗传学的更清晰理解可能会带来更好的治疗方法,尤其是在分层医学或精准医学领域。这一概念依赖于识别出特定患者群体,这些群体在接受某种针对特定通路的药物治疗时,可能会有更好的或更差的反应。如果某条通路在某一患者亚群中与疾病特别相关,并且可以根据他们的基因特征识别出来,那么理论上治疗应该针对这一亚群。这种方法可以识别出对某种治疗剂反应更好的患者,因为他们的基因风险特征表明相关通路的调控方式有所不同。尽管这种方法可能会减少新药的市场规模,但在某一亚群中提高疗效的做法总体上仍可能是有益的,特别是如果这意味着该药物可以在尽管全人群试验显示疗效有限的情况下继续开发。


值得注意的是,这种方法在概念上与现有的哮喘患者分层策略非常相似,例如使用嗜酸性粒细胞计数作为抗IL-5疗法的生物标志物。然而,迄今为止,尽管已经知道支持性的遗传数据能够提高药物进入市场的可能性,但在哮喘等疾病的许多靶点药物开发中(如IL-5、IL-4和TSLP),GWAS数据并未成为主要驱动因素。


结论与展望


过去的15年中,我们在理解慢性呼吸系统疾病的遗传基础方面取得了显著进展。未来十年的挑战在于揭示那些驱动遗传变异与呼吸系统疾病风险或疾病进展速度之间关联的机制。疾病的遗传信息提供了宝贵的见解,通常能够超越我们的先入为主。尽管一些与呼吸系统疾病风险相关的基因变异符合我们对基因功能的预期,但也有许多基因是我们之前未曾考虑过的。例如,肺功能变化和慢阻肺病最强的遗传关联之一是在NPNT位点,该位点编码肾连蛋白。肾连蛋白是小鼠和人类肾脏发育和功能的重要调节因子,之前并没有被认为在肺脏中起作用。这一结果引发了对肾连蛋白在肺发育中作用的研究,发现肾连蛋白可能通过整合素α-8促进肺叶正常发育。因此,更好地理解慢阻肺病的遗传结构将继续提供潜在疾病机制的见解。


展望未来,可以通过几个关键领域的进展进一步深化对呼吸系统疾病遗传学的理解。

(1)利用规模更大且种族更加多样化的队列研究,将有助于更精确地定位基因变异,并进行更有效的基因映射。

(2)增加呼吸系统相关的外显子组和全基因组测序数据集,将推动罕见变异的深入分析。

(3)收集更多、更具针对性的肺部组学数据(例如,人口级别的RNA测序和单细胞、空间转录组学等),将帮助我们更高分辨率地理解基因表达模式。此外,蛋白质组学数据能够帮助区分哪些变异影响基因表达或翻译后调控。

(4)将组学数据与遗传关联数据更好地整合,可以改进变异到基因的映射。例如,孟德尔随机化技术能够通过定义与目标蛋白质表达相关的SNP,帮助我们更好地理解因果关系。

(5)更好的体外肺发育和修复模型将有助于清晰地定义呼吸系统疾病中关键基因的作用。通过收集更多、更高质量的基因组学数据,我们将更深入地理解呼吸系统疾病,从而为患者管理提供更好的策略。


编译:堕梦洁 邹秉璋 李昊搏;审校:张竹 杨沛然 翟振国


<< 点击下方附件可查看文献 >>


* 文章仅供医疗卫生相关从业者阅读参考


本文完

责编:Jerry

512