This is a translation in German. You can also read the original English version.
January 28, 2021
Geschrieben von Jamal Nasir, Brooke Wolford und Kumar Veerapen, ins Deutsche übersetzt von Nils Koelling, Christina Roos, Eva Schulte, Claudia Schurmann und Alexander Teumer im Namen der COVID-19 HGI.
Herausgegeben von Emi Harry, Atanu Kumar Dutta und Rachel Liao
Hinweis: Die COVID-19 Host Genetics Initiative (HGI) repräsentiert ein Konsortium von über 1000 Wissenschaftlern aus über 54 Ländern, die zusammenarbeiten, um Daten und Ideen auszutauschen, Patienten zu rekrutieren und wissenschaftliche Ergebnisse zu verbreiten. Für einen Leitfaden zu unserem Studiendesign oder den Ergebnissen vom Juli 2020 (Version 3) lesen Sie bitte unseren ersten Blog-Beitrag. Unsere Forschung baut auf den vorangegangenen Ergebnissen auf, und wir fassen unsere neuesten Erkenntnisse in Blog-Beiträgen und im Ergebnisbereich unserer Website zusammen. Wenn Ihnen ein Fachbegriff hier nicht geläufig sein sollte, senden Sie uns bitte eine E-Mail an hgi-faq@icda.bio - wir werden die Erklärungen hier gerne aktualisieren, um das Verständnis zu verbessern. In den kommenden Wochen werden zusätzliche Informationen zur Erläuterung von Konzepten oder Fachtermini zur Verfügung gestellt werden. In der Zwischenzeit können Sie einen Blick auf diese Seite werfen, die Ihnen die Grundlagen der Genetik ein wenig näher bringt. Wir bitten um Ihr Verständnis, dass ein Großteil der verlinkten Fachliteratur leider lediglich in englischer Sprache zur Verfügung steht.
Im Juli 2020 berichteten wir über die Identifikation genetischer Varianten im Menschen, die mit einem schweren Verlauf der COVID-19 Erkrankung assoziiert sind (siehe Ergebnisse hier), und über das Ergebnis einer genomweiten Assoziationsstudie (engl. genome-wide association study (GWAS)) an 3.199 COVID-19-Patienten und 897.488 Kontrollen (siehe auch unseren Blog-Post für Nicht-Wissenschaftler bezüglich weiterer Informationen). Seitdem haben wir die in unsere Studie eingeschlossenen Fälle um fast das Zehnfache auf über 30.000 COVID-19 Patienten und 1,47 Millionen Kontrollpersonen erhöht. Dabei haben wir Daten aus 34 Studien und 16 Ländern gemeinsam analysiert. Eine Liste der beteiligten Studien finden Sie hier. Abbildung 1 zeigt die beiden Hauptansätze, mit denen wir die Daten analysieren.
Abbildung 1: Definition der Fälle und Kontrollen für die beiden von uns in dieser Studie durchgeführten Analysen. SARS-CoV-2 ist das Virus, das die COVID-19-Infektion verursacht. Die Abbildung wurde in modifizierter Form aus Andrea Gannas Vortrag über die COVID-19 HGI auf der Tagung der American Society of Human Genetics im Oktober 2020 übernommen.
Wie haben sich unsere Ergebnisse durch die Erhöhung der Stichprobengröße verändert?
Unsere Initiative hat jetzt robuste Hinweise auf sieben genomische Regionen, die mit einer schweren COVID-19 Erkrankung in Zusammenhang stehen (Abbildung 2). Diese befinden sich auf den Chromosomen 3, 6, 9, 12, 19 und 21. Zudem existiert ein zusätzliches Signal auf Chromosom 3, das mit dem Risiko, überhaupt eine SARS-CoV-2 Infektion zu bekommen, assoziiert ist (Abbildung 3). Unsere statistisch signifikanten und belastbaren Ergebnisse sind das Resultat qualitativ hochwertiger Daten, die uns durch weltweite Kooperationspartner zur Verfügung gestellt wurden. So gehen viele der neu beschriebenen genetischen Regionen auf die Studie Genetics of Mortality in Critical Care (GenOMICC) (Pairo-Castineira et al.) zurück, die eine Verdoppelung unserer Fallzahlen ermöglichte. Dies gilt insbesondere für die Zahl von COVID-19-Patienten, die schwer krank waren und im Krankenhaus behandelt werden mussten.
Die jüngste GWAS führte zur Identifikation von inzwischen sieben verschiedenen chromosomalen Regionen, die mit einem schweren Verlauf von COVID-19 assoziiert sind. Die von uns identifizierten Regionen auf den Chromosomen 3, 6, 9, 12, 19 und 21 (Abbildung 2) beherbergen Gene, welche das Immunsystem regulieren oder bekanntermaßen bei Lungenerkrankungen eine Rolle spielen.
Wie genau sind diese chromosomalen Regionen zu beurteilen?
Abbildung 2. Manhattan Plot der Ergebnisse der GWAS für den COVID-19-Schweregrad bei 8.638 hospitalisierten (d.h. in ein Krankenhaus eingewiesenen) COVID-19-Patienten und 1,7 Millionen Kontrollpersonen. Signifikante Assoziationen sind durch rote Kästchen um deren “Spitze” gekennzeichnet. Statistische Signifikanz besteht, wenn ein Assoziationssignal die horizontale rote Linie, die den vorgegebenen Grenzwert für statistische Signifikanz markiert, überschreitet (entspricht einem niedrigerer p-Wert). Diese neuen Daten ergänzen die bereits bekannten Assoziation auf Chromosom 3. Benannt sind die Signale nach benachbarten Genen mit potenziell relevanter biologischer Bedeutung. Eine Erklärung dieser Methode der Datenvisualisierung finden Sie in der Fußnote unseres ersten Blogposts.
Wir konnten die Ergebnisse vom Juli 2020 bestätigen. Damals fanden wir einen Zusammenhang zwischen genetischen Varianten auf Chromosom 3 und dem COVID-19-Schweregrad bzw. der Anfälligkeit für eine SARS-CoV-2 Infektion. Über diesen genetischen Zusammenhang wurde auch in anderen neueren Studien berichtet, darunter Ellinghaus et al, Shelton et al, Pairo-Castineira et al und Roberts et al. Die hier beschriebene Region auf Chromosom 3 liegt in der Nähe mehrerer Gene, die bekanntermaßen das Immunsystem regulieren (sie kodieren zum Beispiel Chemokinrezeptoren wie CXCR6, CCR1, CCR3 und CCR9).
Weitere identifizierte genetische Varianten liegen auf Chromosom 6 in der Nähe von FOXP4, einem Gen, das bei der Entstehung von Lungenkrebs eine Rolle spielt. Auffällig ist, dass die in unserer Studie mit dem COVID-19-Schweregrad assoziierten genetischen Varianten in verschiedenen Populationen unterschiedlich häufig auftreten. Genetiker verwenden die Häufigkeiten einer genetischen Variante, um auf mögliche Auswirkungen dieser Variante auf ein bestimmtes Merkmal oder eine bestimmte Krankheit zu schließen. Je seltener dabei eine Variante ist, desto wahrscheinlicher ist ihr Einfluss auf ein bestimmtes Merkmal oder ein erhöhtes Krankheitsrisiko. In der europäischen Bevölkerung ist die in der Nähe von FOXP4 gelegene Variante selten und findet sich in ca. 1% der Bevölkerung. In der ostasiatischen (39%) und lateinamerikanischen (18%) Bevölkerung tritt sie deutlich häufiger auf. Wir verstehen noch nicht, welche Auswirkungen dieser Unterschied auf den COVID-19-Schweregrad haben könnte.
Eine weitere identifizierte Region auf Chromosom 6 liegt im sogenannten “major histocompatibility complex” (MHC). Dieser enthält Gene, die wichtige Proteine des Immunsystems bilden. Der Effekt von genetischen Varianten in dieser Region war jedoch von Studie zu Studie sehr unterschiedlich. Es ist daher möglich, dass dieses Signal für eine bestimmte Patientenpopulation spezifisch ist.
Vielleicht haben Sie schon aus den Nachrichten erfahren, dass auch Blutgruppen mit COVID-19 in Verbindung gebracht werden: Blutgruppe A geht mit einem erhöhten Risiko für einen schweren Verlauf einher, während Blutgruppe 0 schützend wirkt. Dieser Zusammenhang wurde im New England Journal of Medicine veröffentlicht und liegt zusätzlich als Vorabpublikation (engl. preprint) einer ähnlichen Studie der Firma 23andMe vor. In unserem ersten Blogpost berichteten wir, dass die COVID-19 HGI das als AB0-Blutgruppenregion bezeichnete Areal auf Chromosom 19 nicht identifizieren konnte. Mit der Verdoppelung unserer Stichprobengröße, sehen auch wir jetzt eine genetische Assoziation in dieser Region. Ähnlich wie die MHC-Assoziation auf Chromosom 6 (siehe oben), waren die Ergebnisse in den verschiedenen Studien jedoch sehr unterschiedlich. Wir sind daher nicht sicher, ob dieses Signal möglicherweise für eine bestimmte Patientenpopulationen spezifisch ist.
Das in unserer Studie auf Chromosom 12 identifizierte Assoziationssignal liegt in der Nähe des OAS-Genclusters. OAS-Gene kodieren Proteine, sogenannte “antivirale Restriktionsenzyme”, die als Schutzmechanismus gegen Viren fungieren. Von den spezifischen genetischen Varianten in dieser Region ist bislang ein schützender Effekt in Verbindung mit chronischer lymphatischer Leukämie bekannt.
Es wurden zwei weitere Regionen auf Chromosom 19 identifiziert.
Die erste liegt in der Nähe von DPP9, einem Gen, das an der Entstehung von Lungenfibrosen beteiligt ist. Interessant ist auch, dass das durch DPP9 kodierte Protein eng mit DPP4 verwandt ist. DPP4 fungiert als Rezeptor, über den das eng mit SARS-CoV-2 verwandte MERS-CoV (Middle Eastern Respiratory Syndrome Coronavirus) in menschliche Zellen eindringt.
Die zweite Region enthält eine genetische Variante im Gen TYK2. Varianten des TYK2-Gens wurden zuvor bei Patienten beobachtet, bei denen eine erhöhte Anfälligkeit für Virusinfektionen (im Rahmen eines sogenannten Immundefizienzsyndroms) vorliegt.
Zudem ist eine bekannte genetische Variation im TYK2-Gen mit mehreren Autoimmunerkrankungen (z.B. Lupus und rheumatoide Arthritis) assoziiert. Träger dieser Variante mit einem reduzierten Risiko für Autoimmunerkrankungen (nicht alle genetischen Varianten sind schlecht und diese Variante schützt vor bestimmten Autoimmunerkrankungen) hatten in unserer Studie einen schwereren COVID-19 Krankheitsverlauf. Obwohl es bei Autoimmunerkrankungen TYK2-spezifische Behandlungsansätze gibt, können diese nicht direkt im Rahmen der COVID-19-Erkrankung angewendet werden. Hier sind weitere Untersuchungen auch deswegen notwendig, da die genetische Variante in TYK2 eine gegensätzliche Wirkung im Rahmen der Autoimmunerkrankungen (schützend) und der COVID-19 Erkrankung (risikosteigernd) hat.
Das Assoziationssignal auf Chromosom 21 liegt in der Nähe der Gene IFNAR2 und IL10RB. Dieses Signal ist besonders interessant, da das IFNAR2-Gen für eine Untereinheit des sogenannten Interferon-Rezeptors kodiert, der für die Immunantwort und antivirale Aktivität wichtig ist. Es laufen bereits klinische Studien zur Verwendung von Interferonen in der Behandlung von COVID-19-Infektionen im Frühstadium. Ergebnisse stehen jedoch noch aus. In unseren Daten fiel auf, dass diese genetische Variante bei Frauen signifikanter mit der Schwere der COVID-19 Erkrankung assoziiert war als bei Männern. Durch die weitere Vergrößerung unserer Probensammlung wird es in Zukunft möglich sein, solche Geschlechtsunterschiede in der genetisch bedingten Anfälligkeit für eine COVID-19 Erkrankung besser untersuchen zu können.
Neben der Studie zum Schweregrad der COVID-19-Erkrankung soll die zweite Analyse der COVID-19 HGI chromosomale Regionen identifizieren, die mit einer Anfälligkeit für eine SARS-CoV-2 Infektion in Verbindung gebracht werden können. Hierbei wurden Patienten mit einem positiven SARS-CoV-2-Test analysiert, die nicht im Krankenhaus behandelt werden mussten. Wir identifizierten Regionen auf den Chromosomen 3, 9 und 21 (Abbildung 3). Die meisten überlappen mit den in unserer COVID-19-Schweregrad-Analyse identifizierten Regionen (Abbildung 2). Darüber hinaus wurde aber noch eine weitere Region auf Chromosom 3 gefunden: diese enthält mehrere Gene, deren biologische Rolle in der SARS-CoV-2 Empfänglichkeit jedoch noch völlig unklar ist (roter Kasten in Abbildung 3).
Abbildung 3. Manhattan Plot der GWAS-Ergebnisse für die Anfälligkeit für eine Infektion mit SARS-CoV-2 in 30.937 COVID-19-Patienten und 1,5 Millionen Kontrollpersonen. Es zeigte sich ein signifikantes Assoziationssignal (gekennzeichnet durch den rote Kasten) zusätzlich zu den Regionen auf Chromosom 3, 9 und 21, die auch mit dem COVID-19-Schweregrad assoziiert sind. Statistische Signifikanz besteht, wenn das Assoziationssignal die horizontale rote Linie, die den vorgegebenen Grenzwert für statistische Signifikanz markiert, nach oben (entspricht einem niedrigerer p-Wert) überschreitet. Eine Erklärung dieser Methode der Datenvisualisierung finden Sie in der Fußnote unseres ersten Blogposts.
Unsere neuesten Ergebnisse klären den genetisch vermittelten Teil der Empfänglichkeit für eine besonders schwere COVID-19-Erkrankung weiter auf. Das verwendete Verfahren (GWAS) hilft dabei, relevante genetische Regionen zu identifizieren, kann den kausalen Zusammenhang aber prinzipiell nicht erklären. Daher sind weitere Studien notwendig, um die wahren ursächlichen Gene in diesen Regionen und die biologischen Mechanismen, die an der Schwere der Krankheit beteiligt sind, zu bestimmen und zu verstehen.
Unsere neuesten Ergebnisse stützen Hinweise aus anderen Studien, dass genetische Varianten im Menschen die Immunantwort bei einer SARS-CoV-2-Infektion beeinflussen und dadurch einen schweren Krankheitsverlauf begünstigen könnten. Verschiedene Arbeitsgruppen nutzen nun unsere Ergebnisse, mit dem Ziel die exakten biochemischen Vorgänge in Folgestudien zu entschlüsseln. Dies könnte helfen, den Krankheitsverlauf genauer zu verstehen und damit die Behandlung von Patienten zu verbessern. Andere laufende Studien versuchen, das ursächliche Gen zu finden, wenn – wie auf Chromosom 3 – in einer Region mehrere Gene in Frage kommen. In diesen Studien geht es neben der Identifikation des ursächlichen Gens auch darum, herauszufinden, in welchem Gewebe und in welchen Zellen dieses ursächliche Gen seinen Einfluss auf den Schweregrad der COVID-19 Erkrankung ausübt (für weitere Informationen geht es hier zum neuen Beitrag im wissenschaftlichen Blog).
Wir vergrößern unsere Studie kontinuierlich. Im Dezember 2020 werden wir unsere Analysen mit einer weiter vergrößerten Fallzahl wiederholen. Wir hoffen, die hier präsentierten Ergebnisse damit zu bestätigen sowie eventuell neue COVID-19-assoziierte Gen-Varianten zu identifizieren. Für zukünftige Studien verfeinern wir außerdem unsere Definition von „Fällen“ sowie „Kontrollen“ weiter. Durch diese zusätzlichen genetischen Studien hoffen wir, das Verständnis dafür zu verbessern, wie genetische Variation den Schweregrad einer COVID-19-Erkrankung und die Anfälligkeit für eine SARS-CoV-2-Infektion beeinflusst.
Unser Dank gilt Shea Andrews und Andrea Ganna für das durchdachte Feedback und die Überarbeitung. Unser besonderer Dank gilt allen Studien, die zu den hier dargestellten Ergebnissen beigetragen haben (Abbildung 4).
Abbildung 4: Liste der Partner, die zur COVID-19 HGI beitragen. Angepasst an Andrea Gannas Vortrag über die COVID-19 HGI auf der Tagung der American Society of Human Genetics im Oktober 2020.