基因或可测算后代身高?华大首次揭秘中国人群基因遗传特征

南方会
+ 订阅

10月10日,华大基因在深圳国家基因库正式对外发布一项迄今为止最大规模的中国人基因组学大数据研究成果。这是由中国科学家主导,历时两年,对14余万中国人的无创产前基因检测数据进行深入研究后,首次揭秘中国人群基因遗传特征的科研成果,也是由华大主导的“百万人群基因大数据研究”项目的首秀。

对此,华大生命科学研究院院长、文章第一通讯作者徐讯博士表示,本次研究成果有两个重要意义。首先,这标志着生命科学产业已经从单个样本的检测和诊断,正式进入了基因大数据时代;其次,也验证了基于大人群的精准医学研究已成为新的科研模式,对基因组学大数据研究具有开创性价值。

14余万无创产前基因检测数据

“揭秘”中国人遗传密码

基因是生命的密码,国家级人群基因组学研究以及对遗传资源的保护与应用是精准医学的基础,直接影响到一个国家在生物医学领域的核心竞争力。大规模人群基因组学的研究,可以发现与疾病显著相关甚至是起决定性作用的遗传变异。

中国在国家级人群基因数据研究上暂时处于落后的状态,主要原因在于大型研究项目的完成需要较长周期,项目设计、样本采集及基因测序需要花费大量的时间与资金,合理利用已有的数据将大大加速这一进程。华大的科学家们发现,无创产前基因检测的基因组测序数据,可以为大规模的人群队列研究提供一个全新的思路。

据估计,目前全球的无创产前基因检测已超过1200万例,仅华大基因一家机构已完成逾350万例。由于无创产前基因检测数据的特殊性,使得现有的分析方法都不能对其进行深层次的研究,导致其蕴含的巨大价值无法被挖掘。

在严格遵从《人类遗传资源管理暂行办法》和生命伦理原则的规范下,以及充分重视知情同意和隐私保护的前提下,华大研究团队选取了14余万无创产前基因检测数据展开了群体水平的研究,开发了一系列适用于此类数据的分析方法,揭示了包括31个省、36个少数民族与汉族在内的中国人群精细的遗传结构,实现了多种表型的全基因组关联研究,揭示了中国人群中病毒序列分布特征,构建了包含约900万个多态性位点的炎黄中国人群基因频率数据库 (CMDB),并成功发表于最新一期的国际顶级学术期刊《细胞》中。

此次发表于《细胞》的成果,是华大研究团队在大规模人群队列研究的一次尝试。华大研究员、文章第一作者刘斯洋博士表示,在这次研究中,建立了全新的研究思路和分析算法,突破了当前学界难以使用超低深度全基因组测序数据进行遗传学研究的局限和挑战,首次证明了无创产前基因检测数据可用于回答遗传学以及医学领域多个重要问题的价值和潜力,该方法和策略可被全球基因组学研究参考与应用。

徐讯表示,此次研究成果不仅填补了大规模中国人基因组学研究领域的众多空白,并表明无创产前基因组测序数据或者类似的全基因组超低深度测序数据可以有效地用于群体遗传学、疾病与表型等领域的高水平研究,并将在遗传病诊断、肿瘤研究、药物研发等领域得到广泛的应用。 

迈出“百万人群基因大数据研究”第一步

生命科学产业进入“基因大数据时代”

值得一提的是,这是高水平国际学术期刊第一次认同在其上发表基因组学文章所使用的数据仅需保存于深圳国家基因库,而无需向海外数据库进行备份,这意味着国际学术期刊对我国遗传资源的充分尊重与认同,也代表着中国已经完全有能力和实力管理保护我国重要的遗传资源。

自2016年正式运营以来,深圳国家基因库已成为我国生物遗传资源存储的重要基础支撑,为我国的遗传资源提供了至关重要的保护,让中国可以将重要的数据存储于国内,而无需上传至国外的数据库进行保存;同时,在确保安全性和规范化的前提下,支持对数据开展严谨的科学研究,这对于我国的基因数据自主权以及行业发展都具有非常重要的战略意义。

徐讯认为,此次研究成果也证明了生命科学产业已经从单个样本的检测和诊断,正式进入了基因大数据时代。未来,将借助对基因大数据的研究和分析,更深刻地了解人类的生老病死,进一步促进对复杂疾病、罕见病、药物研发、肿瘤基因解读等方面的研究与应用开发,从而推动精准医学事业的发展,加速基因科技在出生缺陷、癌症、感染等领域的应用,并更好地指导个人的健康管理。

记者了解到,华大在2016年正式发起“百万人群基因大数据研究”项目,此次研究项目正是其第一期的成果。华大希望通过对百万中国人群基因组测序数据的综合研究,促进遗传学研究与精准医学事业的发展,更好地实现基因科技造福人类的愿景与使命。

南方人免疫力更强

后代身高或可通过基因测算?

虽然我国人口众多,历史悠久,但长久以来,由于实验研究抽样不充分,导致我们对自身的遗传特征认识不多。

在本次研究中,华大的研究小组成功构建了包含904万个多态性位点在内的中国人基因频率数据库(CMDB),其中约有20万个多态性位点属于首次发现,这是目前正式发表的最大规模的中国人群基因频率数据库。

值得一提的是,研究小组确定了6个在地区纬度方向上受到强烈自然选择的基因,它们在基因频率上呈现明显的南北差异,充分展现了饮食、气候、病原体等环境因素对中国人群的演化所起到的选择作用。

比如,由于古代在北方、西北等地区如新疆、青海和内蒙古等省份可能由于蔬菜获取比较困难,导致生活在这些地区的人们肉类摄入比例较大,因此,促进脂肪代谢率的等位基因在这些地区有明显富集的趋势。

与机体免疫功能相关的编码了红细胞补体受体I的基因CR1呈现了南方富集的现象。古代中国南方被称为南蛮瘴气之地,自然环境恶劣,病原微生物尤其是疟疾盛行,因此对于生存于该地区的人在免疫力方面有较高的要求。

通过数据分析,研究小组一次性发现并且验证了48个与身高以及13个与BMI(身体质量指数)显著相关的基因位点,包括这些位点在内的常见突变位点分别解释了48%的身高遗传率以及10%的BMI遗传率。随着研究的进一步深入,科学家和算法工程师有可能可以利用这些信息构建适合于中国人的身高预测模型,通过基因数据推断个人的身高情况。

另外,研究小组对怀孕年龄和双胎怀孕两个表型进行了深入分析,发现了两个与怀孕年龄显著相关的基因位点,暗示着这两个位点的突变与生育力密切关联; 与此同时,还在NRG1基因中发现了一个和双胞胎妊娠显著相关的突变位点,也就是说携带NRG1基因的突变,有更高的几率怀上双胞胎。

【记者】张光岩

编辑 祁觊
加载全文
版权声明:未经许可禁止以任何形式转载
热门评论
快来抢沙发
    继续阅读
    还没看够?打开南方+看看吧
    立即打开