News

This is a translation in Chinese. You can also read the original English version.

Chinese-3rd-blog

April 07, 2021

COVID-19 HGI数据冻结第5版的结果(2021年1月)

2021年3月2日

Minttu Marttila, Annika Faucon, Nirmal Vadgama, Shea Andrews, Brooke Wolford, and Kumar Veerapen 以COVID-19 HGI的名义撰写

翻译:周薇,李若琳,周思睿

注:COVID-19宿主遗传学倡议(HGI)是一个由来自54个国家的2000多名科学家组成的联盟,以此来共同合作共享数据、想法、招募患者和传播我们的研究结果。如需了解我们的研究设计,请阅读我们的第一篇博文。我们的研究是反复进行的,我们通过博客文章和网站上的结果部分总结我们的新结果。最后,如果有不熟悉的词汇,请发邮件到hgi-faq@icda。我们很乐意更新这里的信息,使其更加清晰。在未来几周内,我们将提供更多的信息来解释概念或术语。在此期间,请看一下这个资源来回顾遗传学的基础知识。

本次发布的科学文章现已在medRXiv上发布。

最新的数据冻结(第5版)增加了遗传学研究结果的样本量和稳健性。

COVID-19 HGI在之前的版本中已经反复显示出稳健的遗传信号,并且代表了历史上最大的全基因组关联研究(GWAS):无论是在研究参与者(>200万个体)还是合作者数量(>2000名科学家)方面。这里,我们描述了最新的数据冻结第5版的结果。在我们之前的数据冻结(第4版)中,我们报告了与严重的COVID-19相关的人类遗传变异(请看我们为非科学家撰写的关于数据发布第3版第4版的博客文章)。我们通过GWAS在3万多名COVID-19患者(即病例)和147万名非COVID-19患者(即对照组)中发现了这些变异。在数据冻结第5版中,我们通过合并来自19个国家47项研究的数据,将样本量进一步增加到近5万例COVID-19病例和200多万例对照(图1)。通过增加样本量,我们也在提高研究结果的可信度。在这次数据冻结中,我们还试图提高人群的多样性。在不同遗传祖先的人群中研究遗传学有助于我们更好地了解影响COVID-19严重性的遗传变异及其在世界各地的影响。在47项贡献研究中,有19项包括了非欧洲人群。

图1:COVID-19 HGI贡献者名单,在数据冻结发布第5版的47项贡献研究中,有19项包括非欧洲人群。改编自Andrea Ganna在2021年1月25日的演讲

研究结构

与之前的数据冻结一样,我们继续研究三种结果(图2)。A)COVID-19危重症(最终依靠呼吸支持或死于COVID-19),B)因COVID-19住院,C)被SARS-CoV-2感染。这些分析旨在捕捉与SARS-CoV-2和COVID-19的易感性和严重性相关的遗传特征。最后一项分析(分析C)旨在检测与报告的SARS-CoV-2感染相关的遗传变异。该分析包括所有病例,而不考虑症状的存在或严重程度。分析结果及其病例和对照的定义和样本大小见图2。

图2:数据冻结5中每个分析的病例和对照的定义。请注意,SARS-CoV-2是导致COVID-19感染的病毒。改编自Andrea Ganna在2021年1月25日的演讲

与COVID-19相关的基因组区域指向先天免疫和肺功能障碍

收集贡献者提供的遗传数据后,我们根据图2中的定义进行了全基因组关联分析研究。在之前的数据冻结4中,我们重点研究了7个染色体区域中COVID-19的易感性和严重性方面的新遗传信号。这些区域指向先天免疫和肺功能障碍的病因:与COVID-19感染相关的最常见临床理解一致。在数据冻结5中,我们确定了所有染色体中15个全基因组范围的显著区域:1个染色体区域仅在危重性分析中具有基因组范围的显著意义(分析A);在严重性分析中,有11个染色体区域的影响要高于已报告的感染相关研究(分析B);这些染色体区域中的4个对SARS-CoV-2报告的感染具有特异性(分析C)。在图3中,我们将这些结果以迈阿密图(曼哈顿图的多版块版本。因为迈阿密的天际线在水面的倒影而命名)的方式展示。

图3. 迈阿密图所示COVID-19全基因组关联结果。上半幅图显示COVID-19住院病例和对照的全基因组关联研究的结果(分析B),下半幅图显示所报告的SARS-CoV-2感染和对照的结果(分析C)。

样本多样化的作用

我们了解到,在许多遗传学研究中,样品采集的多样性是一个重要问题(详细介绍在此)。因此,随着研究的进行,我们旨在改善样本采集的多样性(图4)。我们所改善的样本收集工作让我们能够发现与COVID-19相关的新遗传因素(我们先前的结果在博客发布3发布4的文章中进行了讨论)。伴随使用我们遗传危险因素鉴定的的分析方法,我们能够观察到基因内或基因附近的遗传变异。到目前为止,我们发现的大多数基因都指向细胞机制,免疫调节和心脏功能方面的风险增加。这些危险因素的鉴定最终有助鉴定基因相关的靶向治疗。

图4. 主要遗传背景组研究在整合分析中对COVID-19宿主遗传学计划的贡献和组成概述。在数据冻结5中,有19项研究贡献了非欧洲人群:7项非洲裔美国人群研究,5项混血美国人群研究,4项东亚人群研究,2项南亚人群和1项阿拉伯人群研究。菱形标志显示在不同地理位置获得的有效样本量(在科学研究中具有统计学显著影响的样本量)。

我们发现了9个与COVID-19相关的新染色体区域。在分析A中,对于危重疾病,它们包括两个基因附近的染色体区域:3号染色体上的LZTFL1和17号染色体上的TAC4。LZTFL1蛋白调节蛋白向睫状膜(根:纤毛)的运输。纤毛是从细胞体延伸出的类似毛发的结构。它们存在于气道,肺和许多其他器官中。LZTFL1也参与免疫反应。TAC4蛋白具有调节血压和免疫系统的功能。

在分析B中,对于COVID-19住院患者,我们发现了4个基因附近变异的关联。首先,我们在1号染色体上的THBS3处发现了一个染色体区域。该基因编码在心脏中表达并在心脏病期间上调的蛋白THBS3。其次,我们在2号染色体上的SCN1A处发现了一个染色体区域。已有显示,SCN1A基因内的变异会引起癫痫和抽搐。再次,我们在8号染色体上的TMEM65处发现了一个染色体区域。该基因编码TMEM65蛋白,在心脏发育,心信号传导和功能调节中起相关作用。它也可能在细胞能量代谢中起相关作用。值得注意的是,在我们的分析中,我们发现TMEM65的变异在东亚人群中的发生频率为12%,在欧洲人群中为1%。等位基因频率描述了某个基因或基因组区域的变异数目。最后,我们在17号染色​​体上的KANSL1处发现了一个染色体区域。已经有人指出,由该基因编码的KANSL1蛋白在神经元传导中起相关作用。

最后,在分析C中,对于报告的SARS-CoV-2感染,我们在基因附近区域中发现了3个新的关联,即3号染色体上的ZBTB11、5号染色体上的DNAH5和19号染色体上的PPP1R15A。首先,我们发现3号染色体上的基因ZBTB11编码ZBTB11蛋白,有研究表示该蛋白可调节免疫细胞发育。其次,我们在5号染色体上的DNAH5处发现了一个染色体区域。有研究表明DNAH5的遗传变异导致原发性睫状运动障碍,纤毛运动缺陷,从而导致反复性胸部感染,耳鼻喉症状,支气管炎和不育。最后,我们在19号染色体上PPP1R15A附近发现了一个染色体区域。该基因编码PPP1R15A蛋白,有研究表示该蛋白可调节细胞生长停滞和细胞死亡,以响应DNA损伤,负向生长信号和错误的蛋白质结构。

在我们的分析中,影响免疫系统的基因在COVID-19中起着重要作用。涉及肺和心脏功能以及神经元传导相关的基因也是我们发现的一部分。先前已有报道,显示心脏疾病是COVID-19的易感因素,而神经元症状也为COVID-19疾病的部分症状。

相关性并不意味着因果关系

关联研究中确定的风险因素可能并不指向COVID-19易感性或严重性的因果基础。因此,我们采用了一种称为孟德尔随机化(MR)的方法,利用基因组信息推断因果关联。MR是一种利用已知影响给定暴露的遗传变异(如BMI)来研究暴露对疾病结果的因果效应的方法。为了更深入地了解,我们在最近的一篇博客文章中描述了MR(迎合科学观众。在三种COVID-19表型中,我们确定了三种COVID-19结果和6个性状之间具有统计学意义的因果关系(在我们测试的38个选定性状中,图4)。我们发现,基因预测的较高体重指数(BMI)与SARS-CoV-2感染和COVID-19住院的风险较高相关。这一结果印证了观察性研究的结果,观察到严重的COVID-19结局风险增加与BMI增加有关。此外,基因预测的吸烟与COVID-19住院风险增加有关。

图5:38个性状与COVID-19严重程度和SARS-CoV-2报告感染之间的遗传相关性和孟德尔随机化因果估计。性状列在X轴上,COVID-19表型列在Y轴上。蓝色代表负遗传相关性和保护性孟德尔随机化(MR)因果估计,红色代表正遗传相关性和风险MR因果估计。更大的方块对应更显著的相关性。通过统计学意义阈值的因果估计值用星号标记。

全球合作努力来了解COVID-19宿主遗传学

在当前COVID-19大流行的全球危机中,这些结果显示了47个不同贡献者的全球努力的力量。我们总共确定了15个与COVID-19易感性和严重性相关的基因组区域。为了进一步探究这些区域的因果关系,我们利用统计推理(即孟德尔随机化)确定了8个与这些COVID-19 GWAS信号具有统计学意义的因果关系的性状。目前,我们正在将结果最终整理成一篇科学文章。随着我们继续在COVID-19全球大流行中披荆斩棘,COVID-19 HGI将“迭代”产生遗传层面的结果。通过共同努力,我们可以产生强大的研究发现成果,以更好地了解COVID-19致病的生物因素和临床表现。

鸣谢

感谢Andrea Ganna博士的周到反馈和评论

Tags
遗传学 生物医学研究 scicomm COVID19