This is a translation in Chinese. You can also read the original English version.
January 20, 2021
COVID-19 HGI 2020年7月2日的结果
Brooke Wolford 和Kumar Veerapen, 代表COVID-19 HGI
翻译:周薇,李若琳
免责声明:首先,请注意这项研究正在进行中。虽然我们已经有了一些发现,但我们需要更多的样本才能对COVID-19研究结果的基因遗传贡献有一个更加透彻的了解。我们在研究中添加的样本越多,我们就越有信心说我们观察到的模式是存在的,并且在不同的患者群体中具有代表性。其次,根据您的基因,我们也无法判断您患重度COVID-19的可能性。请勿用我们的发现来按基因型诊断COVID-19患者,一定要请医疗专业人员指导医疗选择。最后,如果此处有任何不熟悉的词汇,请发电子邮件给我们,邮箱地址是hgi-faq@icda.bio。我们很乐意在此处进行不断更新以提供更多信息。在接下来的几周中,我们将提供解释概念或术语的其他信息。在此期间,请查看此资源以复习遗传学的基础知识。
COVID-19大流行病影响了世界各地社会的日常生活。世界各地的科学家都在努力更好地了解这个病毒和疾病。我们代表着这样一个团体--COVID-19宿主遗传学计划(HGI)--这是一个由遗传学家组成的国际团队,致力于识别影响感染SARS-CoV-2后的宿主反应与其后继并发症的人类遗传变异。通过合作,我们很想知道一个人的DNA的哪些变异会影响一个人患上COVID-19的概率,以及如果他们感染COVID-19后患病的严重程度。
COVID-19 HGI研究设计
在我们的研究中,我们在对病例(即SARS-CoV-2检测阳性的住院病例)与对照组(即不患COVID-19的普通人群)之间的遗传变异进行比较。这种比较被称为全基因组关联研究,或GWAS。请看此视频或信息图,获取对GWAS的图解说明! 截至2020年7月,我们已经合并了8项不同研究的结果,共计3,199例病例和897,488例对照。
图1:数据冻结3的当前结果(2020年7月)。上面显示的结果比较了3,199例病例(因COVID-19住院的患者)和897,488例对照(COVID-19阴性的患者)之间的遗传数据。
COVID-19 HGI发现与COVID-19严重程度有关的遗传变异
上图1显示了COVID-19 HGI的最新结果的可视化摘要。该图形称为曼哈顿图,关于这种可视化的完整描述请参考脚注。简而言之,曼哈顿图用于可视化一个性状(如COVID-19)和整个基因组的遗传变异之间的关联。我们在3号染色体上观察到一个具有统计学意义的区域(注意3号染色体上方的垂直虚线,如水平x轴所示)。有时,一个区域包含多个彼此靠近的基因,这需要额外的研究来将统计学意义上的区域缩小到涉及COVID-19严重性的特定基因。在3号染色体上发现的区域与多个基因重叠(见图2中列出的所有基因名称)。 目前还不清楚这个狭窄区域内的哪个特定基因与COVID-19的严重性相关,不过我们确实发现了有一些有趣的线索。该区域内有几个与趋化因子相关的基因,如CXCR6和CCR1。趋化因子控制免疫细胞的运动,对先天免疫系统的正常运转至关重要。SLC6A20基因也在这个区域,它产生一种已知与ACE2结合的蛋白质。ACE2蛋白就像SARS-CoV-2病毒用来进入我们细胞的门一样(图3)。这意味着SLC6A20的遗传变异有可能影响病毒进入宿主细胞的过程,但我们发现的这些结果只是研究过程中的第一步。
图2: 来自UCSC基因组浏览器的可视化。此图中的轨道显示了3号染色体上我们感兴趣的区域中的基因(例如CXCR6,SLC6A20,CCR1)。
图3:ACE-2受体图解。插图显示了ACE-2如何作为受体在宿主细胞中发挥作用,从而介导来自SARS-CoV-2病毒的感染。此图改编自https://www.rndsystems.com/resources/articles/ace-2-sars-receptor-identified。
与其他研究的结果进行比较
你可能在最近的一篇新闻中听说过,血型似乎与COVID-19有关,其中A型与较高的风险相关,O型具有保护作用。最近发表在《新英格兰医学杂志》(NEJM)上的一篇期刊文章描述了对意大利和西班牙的1,980名个体进行的关于严重的COVID-19(如因呼吸衰竭而住院)感染患者的基因关联分析(23andMe也重复了这项研究)。在这项研究中,9号染色体上的ABO血型基因似乎与COVID-19显著相关。然而,这项研究在分析中使用了献血者作为对照组,而献血者中往往有更多的O型个体,所以他们可能不是理想对照。而这一点在我们的数据中得到了印证:从图1中的曼哈顿图中可以看到我们在9号染色体上方没有看到有统计学意义的结果(即红线以上的点上升)。这意味着COVID-19 HGI分析,其中包括NEJM的研究数据,现阶段不支持ABO血型基因的关联。我们需要更大的样本量来明确该区域是否与COVID-19相关。
认识到我们研究的局限性
没有任何研究设计是完美的,我们想强调一下我们研究的一些局限性。首先,上述结果是初步的,来自2020年7月提交的数据。虽然我们有足够的样本来进行一些初步观察,但在未来的重复研究中,更大的样本量有助于我们对结论更加充满信心。遗憾的是,更大的样本量意味着更多的人感染了COVID-19,这是我们所不愿看到的;尽管如此它也提高了我们发现宿主遗传学和疾病结果之间的模式的能力。
其次,疾病严重性的定义可能因人而异。我们假定对照组没有COVID-19,但我们知道社区中有很多无症状的人,因此对照组中的一些人可能实际上已经感染了COVID-19但并没有被发现。然而,这些局限性可以通过增加评估病例和对照的数量来克服:我们分析的样本越多,由于研究设计的局限性所观察到假阳性信号的风险就越低。而一旦确定了一个阳性信号,我们就可以专注于一个较小范围的研究,对我们的病例组和对照组进行更具体的定义,以验证这一发现。最后,利用我们的遗传发现来深入了解疾病的机制,还需要进一步的研究。
我们的下一步工作
为了解决样本量的限制,我们将继续接受提供贡献的研究结果的提交。下一次分析将在9月底进行,结果将在2020年10月初发布。我们希望在下一次结果发布中获得更多有意义的见解,其样本规模有望达到现在的1.5倍。我们还希望收集更多有关COVID-19患者症状的详细信息。2020年10月再来这里阅读我们的研究成果吧!
利用这些初步结果,“侦探”工作已经开启。我们的联盟和其他科学家可以进行更多的研究,以更好地了解受这些基因影响的生物过程,以及如何与COVID-19结果相关。如果你想了解后续研究的更多细节,请前往这个链接。其中一项研究将探索这种基因变异如何与特别是受影响最严重的住院患者的结果相关。我们很期待能更进一步地了解我们的研究结果,以便有望为COVID-19患者带来更好的临床管理或疾病治疗方法。
其他资源
要阅读更多关于COVID-19宿主遗传学计划的信息,请查看大众媒体的报道。
鸣谢
感谢Rachel Liao, Caitlin Cooney, CGC, Karen Zusi, Andrea Ganna, Alina Chan, Sophie Limou, Shea Andrews, and Jamal Nasir的反馈和修改。
脚注
曼哈顿图(因为峰顶应该看起来像纽约市的天际线而得名),是GWAS结果的一种常见的可视化结果图。该图的水平线或x轴("染色体")显示了23条染色体上的遗传变异的位置(人类有22对染色体,以及X和Y性染色体的某种组合),竖线或y轴显示的是一种称为p值的统计学显著性的度量,转化为负对数标度。曲线图上的每一点都显示了给定染色体位置上的遗传变异(称为SNP,发音为 "snip")与每个人的疾病结局之间关联的统计学显著性(p值)。纵轴上的点越高,说明该SNP与其对应的结果(如COVID-19严重程度)相关的可能性越大。然而我们的方法是谨慎的:许多研究要求p值小于0.05才能认为发现是显著的,而我们要求p值小于0.00000005(用红线表示),以此来提高我们研究结果的可信度。如果该点p值高于红线,我们认为该基因关联具有 "统计学意义",因此可以设计实验来进一步验证和了解这些SNPs的生物学相关性。
COVID-19 HGI数据冻结4的结果 (2020年10月)
11月24日, 2020
撰写:Jamal Nasir, Brooke Wolford, and Kumar Veerapen 代表 COVID-19 HGI
编辑:Emi Harry, Atanu Kumar Dutta, and Rachel Liao
翻译:周薇,李若琳
注:COVID-19宿主遗传学计划(HGI)代表了一个由来自54个国家的1000多名科学家组成的联盟,我们通过合作分享数据、想法、招募患者并传播我们的研究结果。关于我们的研究设计或2020年7月(数据冻结3)的结果的初步介绍,请阅读我们的首篇博客文章。我们的研究是反复进行的,我们通过博客文章和发表在网站上的结果部分总结我们的新结论。最后,如果这里有任何词汇您不熟悉,请发邮件给我们:hgi-faq@icda.bio——我们很乐意在此处更新以提供更清晰的信息。在未来几周内,我们将提供额外的信息来解释概念或术语。在这期间,请看一下此处的资源来回顾遗传学的基础知识。
COVID-19宿主遗传学计划增加了更多的样本,确定了与COVID-19严重性强相关的遗传区域。
2020年7月,我们报告了与严重的COVID-19病例相关的人类基因变异的识别(请在此处选择第3版结果的标签),以及对3199名COVID-19患者(病例)和897,488名对照的基因组全基因组关联研究(GWAS)的结果(更多信息请参见我们为非专业人士撰写的博客文章)。此后,我们通过合并来自16个国家34项研究的数据,将样本量增加了近10倍,达到3万多例COVID-19病例和147万例对照。您可以在此处找到我们合作伙伴的名单。我们的数据集的分类如图1所示。
图1:我们研究中进行的每一项分析的病例和对照的定义。要注意的是,SARS-CoV-2是导致COVID-19感染的病毒。改编自Andrea Ganna在2020年10月美国人类遗传学会会议上关于COVID-19 HGI的演讲。
增加样本量会有什么结果改变?我们现在已经为7个与严重的COVID-19病例相关的基因组区域提供了强有力的证据(图2),分别位于3号、6号、9号、12号、19号和21号染色体上;以及3号染色体上一个与COVID-19部分易感性相关的额外信号(图3)。我们相信,我们的重大发现是来自全球贡献者提供的高质量数据的结果。其中许多区域是由重症监护中的死亡率遗传学(GenOMICC)研究(Pairo-Castineira等)确定的,这使得我们的病例数增加了一倍,特别是在COVID-19重症和住院患者中。
新的研究结果表明,免疫力和肺功能可能是导致发展至严重COVID-19的原因。
最新的GWAS明确确定了七个不同的染色体区域,这加强了COVID-19严重程度可归因于免疫系统紊乱的证据。我们进行了一项分析,将染色体区域与经历严重COVID-19症状的患者(即住院患者)联系起来。我们成功地识别出3、6、9、12、19和21号染色体上的区域(图2),这些区域蕴藏着调节免疫力或在肺部疾病中发挥作用的基因。这些染色体区域分别意味着什么?
图2。曼哈顿图显示了8,638名住院COVID-19病例和170万名对照的COVID-19严重程度的GWAS结果。分析发现了独立的显著关联,如红色水平线以上的基因“峰值”周围的红框所示,红色水平线代表了预先确定的统计p值阈值。这是对我们先前报道的3号染色体关联的补充。基因座被附近具有潜在生物学意义的基因标记。请参阅我们的第一篇博客文章的脚注,了解这种数据可视化的解释。
3号染色体
我们重复了2020年7月的研究结果,发现3号染色体上的遗传变异与COVID-19的严重程度和部分易感性之间存在关联 (这一区域在Ellinghaus等人、Shelton等人、Pairo-Castineira等人、Roberts等最近的研究中也有报道)。3号染色体这一区域与几个著名的趋化因子受体的免疫相关基因,包括CXCR6、CCR1、CCR3和CCR9。
6号染色体
我们在最接近FOXP4基因的区域(在6号染色体上)发现了遗传变异,该基因在肺癌的发生中起着重要作用。值得注意的是,在我们的研究中,与COVID-19严重程度相关的遗传变异在某些人群中出现的频率高于其他人群。遗传学家利用遗传变异的频率来推断这些变异对给定性状或疾病的潜在影响。一种变异越罕见,这种变异就越有可能给某种特性或疾病带来风险。在欧洲,这种与FOXP4相近的变异被认为是罕见的,它只出现在1%的人口中。然而,它在东亚(39%)和拉美裔/拉丁裔(18%)人群中出现得更为频繁,因此我们尚不清楚这对COVID-19严重程度的影响。
此外,我们在主要组织相容性复合体(MHC)的6号染色体上发现了第二个独立区域,该区域包含产生重要免疫系统蛋白的基因。然而,在不同的研究中,来自这个区域的影响是非常不同的,我们不确定这个信号是否针对特定的患者群体。
9号染色体
你可能已经从新闻中了解到某种血型与COVID-19有关:A型血风险更高,O型血具有保护作用。这项研究发表在《新英格兰医学杂志》和23andMe研究的预印本上。在我们的第一篇博客文章中,我们报道了COVID-19 HGI没有在9号染色体上识别一个称为ABO血型区域的区域。现在,随着我们的样本量翻倍,我们确实观察到了这个区域的保护性基因联系。然而,类似于在6号染色体上观察到的MHC关联,这种关联在不同的研究中是非常不同的,我们不确定这种信号是否针对特定的患者群体。
12号染色体
在12号染色体上,我们发现了OAS基因簇附近的关联,OAS基因簇编码抗病毒限制性内切酶激活剂,起着抵御病毒的保护作用。该区域的特殊遗传变异已被证明与慢性淋巴细胞白血病相关,具有保护作用。
19号染色体
我们在19号染色体上鉴定了两个区域。第一个基因靠近DPP9, DPP9基因被认为与增加肺纤维化风险有关。有趣的是,DPP9蛋白与DPP4蛋白密切相关,DPP4蛋白影响另一种冠状病毒进入人体细胞的能力——这种病毒导致中东呼吸综合征(MERS)。
第19号染色体上的第二个基因组区域包括一个接近TYK2基因的遗传变异。TYK2基因的变异之前已经在原发性免疫缺陷综合征患者中观察到,这些患者对免疫系统刺激的反应减弱,对病毒感染的敏感性增加。
TYK2中一个众所周知的基因变异可以降低患有这种变异的人患多种自身免疫性疾病(例如狼疮和风湿性关节炎)的风险(并非所有的变异都是有害的,而这种变异可以保护TYK2免受这种特征的影响)。在我们的研究中,同样的TYK2变异与COVID-19严重性相关,但它与COVID-19严重程度的风险增加相关。尽管现有针对TYK2的自身免疫性疾病治疗方法可以重新用于治疗COVID-19,但仍需要更多的研究,因为TYK2的基因变异在自身免疫性疾病(保护性)和COVID-19(风险)之间具有相反的作用。
21号染色体
最后,21号染色体上的关联在IFNAR2和IL10RB基因附近。我们注意到这个信号相当有趣,因为IFNAR2基因编码了一种被称为干扰素受体的免疫分子的亚单位,干扰素受体对抗病毒免疫很重要。目前使用干扰素治疗COVID-19感染早期患者的临床试验正在进行,但仍有许多未知情况。有趣的是,我们还发现与严重COVID-19患者相关的基因变异在女性中比男性更明显。因此,我们正在改进我们从合作伙伴收集样本的方式,以询问关于住院COVID-19患者基因关联中的性别偏向的相关讯息。
3号染色体上的另一个区域与COVID-19部分易感性有关
COVID-19 HGI还分析了染色体区域与COVID-19部分易感性患者(即COVID-19检测阳性但未住院的患者)之间的关联。我们确定了染色体区域3、9和21(图3)。这些区域大部分与COVID-19严重性分析的结果重叠(图2)。但是我们也发现了3号染色体上的一个包含多个基因的区域,我们不确定哪一个基因导致了这个关联(图3中红色框)。
图3. 曼哈顿图显示了30,937例COVID-19部分易感性和150万对照的GWAS结果。分析发现,除了3号、9号和21号染色体上与COVID-19严重性相关的区域外,还有一个与COVID-19部分易感性的独立显著关联(用红色方框表示,围绕着遗传 "峰 "上升到代表预定统计p值阈值的红色水平线之上)。关于这个数据可视化的解释,请看我们第一篇博文的脚注。
我们的下一步
我们很高兴地报告,我们的最新发现进一步解释了发展成严重COVID-19病例的潜在遗传病因。然而,重要的是要记住,虽然GWAS帮助我们确定了这些区域,但还需要更多的研究来确定这些区域的真正致病基因以及导致疾病严重性的生物学机制。
与其他研究一致,我们的最新结果提供了额外的证据,表明人类遗传变异可能通过影响SARS-CoV-2感染者的免疫反应来影响COVID-19患者的严重性。一些科学家团队正在利用这些GWAS结果进行后续分析,以发现涉及严重COVID-19的生化途径。这些可以为人们了解疾病进展提供线索,从而增加我们对患者的临床解读和管理。当一个相关区域有许多基因时,如3号染色体上的基因,持续的随访分析也有助于确定单一的致病基因,并确定哪些组织可能受到这些基因变异的影响(更多内容,请阅读最近这篇科普博文)。
正如7月至10月病例的增加所说明的那样,我们正在不断扩大研究范围。在2020年12月的下一次数据冻结时,我们将以更大的样本量重复我们的分析,这将有望重复我们在这篇文章中的发现,并有可能确定与COVID-19相关的新的遗传变异。此外,我们正在完善我们在未来的分析中对病例和对照的定义。通过这些额外的遗传学研究,我们希望能够提高人们对遗传变异如何影响COVID-19严重性和部分易感性的理解。
鸣谢
感谢Shea Andrews and Andrea Ganna 的反馈和修改. 我们想特别感谢所有对现有结果做了贡献的研究 (图 4).
图4:为COVID-19 HGI做出贡献的合作伙伴名单。编辑自Andrea Ganna在2020年10月美国人类遗传学会会议上关于COVID-19 HGI的演讲。
标签
COVID19
遗传性 生物医学研究 SCI通讯