News

This is a translation in Russian. You can also read the original English version.

Russian-3rd-blog

April 07, 2021

Результаты 5го этапа проекта COVID-19 HGI (Январь 2021)

2 марта, 2021

Авторы: Minttu Marttila, Annika Faucon, Nirmal Vadgama, Shea Andrews, Brooke Wolford, and Kumar Veerapen (представляют консорциум COVID-19 HGI)


Перевод на русский язык: Александр Ракитько

Замечание: COVID-19 Host Genetics Initiative (HGI) является консорциумом из более 2000 ученых из более 54 стран, целью которых является обмен данными, идеями, набор пациентов и распространение полученных результатов. Описание дизайна исследования можно найти здесь. Публикация результатов в рамках проекта происходит поэтапно. Результаты каждого этапа описываются в блоге, а также на странице результатов нашего вебсайта. В случае, если какие-либо термины в этой статье окажутся не ясны, просим написать на hgi-faq@icda.bio — мы будем рады добавить пояснения. В ближайшем будущем будут добавлены дополнительные материалы о методах и терминологии. Пока же можно ознакомиться в основами генетики по данной ссылке.

Научную статью, посвященную данному релизу, можно найти на medRXiv.

В 5ом релизе данных был увеличен размер когорт и повысилась надежность обнаруженных генетических ассоциаций

Предыдущие этапы COVID-19 HGI последовательно демонстрировали устойчивые генетические сигналы. На текущий момент COVID-19 HGI представляет наиболее масштабное полногеномное исследование по поиску ассоциаций (GWAS) в истории как по числу участников исследования (>2 миллионов людей), так и по числу исследователей (>2,000 ученых). Здесь мы описываем результаты нашего последнего (пятого) релиза данных. В рамках предыдущего этапа (релиз 4) были обнаружены генетические варианты, ассоциированные с тяжелым течением COVID-19 (смотрите наши предыдущие посты в блоге по релизу 3 и релизу 4). Эти варианты были выявлены в рамках GWAS анализа более 30,000 переболевших COVID-19 (больные) и 1.47 миллиона контролей. В рамках пятого этапа исследования мы продолжили увеличивать размер исследуемых когорт: в анализ вошли почти 50,000 COVID-19 больных и более 2ух миллионов контролей из 47 исследований из 19 стран (Рисунок 1). С ростом размера выборки также возросла и достоверность находок. Кроме того, в рамках данного релиза мы постарались увеличить разнообразие исследуемых популяций. Изучение популяций с разным происхождением позволяет лучше понять, как генетические варианты влияют на тяжесть COVID-19 и их роль в разных частях мира. Из 47 исследований 19 включали неевропейские популяции.

Рисунок 1. Список участников 5го этапа COVID-19 HGI. Из 47 исследований 19 включали неевропейские популяции. Получено из презентации Andrea Ganna от 25 января 2021 года.

Структура исследования

Как и в предыдущих этапах мы продолжили изучать 3 фенотипа (Рисунок 2): A) Критическое течение COVID-19 (респираторная поддержка или смерть от COVID-19), B) госпитализация с COVID-19, C) инфицирование SARS-CoV-2. Цель этих анализов — обнаружить генетические варианты, которые влияют как на предрасположенность, так и на тяжесть SARS-CoV-2 и COVID-19. В последнем анализе (анализ C) определяются генетические варианты, ассоциированные с инфицированностью SARS-CoV-2. В анализ включались все больные безотносительно наличия и тяжести симптомов. Определение фенотипов и размеры когорт продемонстрированы на Рисунке 2.

Рисунок 2. Определение больных и контролей для каждого анализа в рамках 5го этапа. SARS-CoV-2 — это вирус, который вызывает инфекцию COVID-19. Получено из презентации Andrea Ganna от 25 января 2021 года.

Геномные регионы, связанные с COVID-19, указывают на врожденный иммунитет и дисфункцию легких

После того, как генетические данные от участников консорциума были собраны, мы провели GWAS анализ в соответствии с определенными фенотипами (Рисунок 2). Ранее в 4ом релизе мы обнаружили новые генетические сигналы на 7ой хромосоме, связанные с заболеваемостью и тяжестью COVID-19. Эти сигналы указывают в сторону этиологии врожденного иммунитета, а также дисфункции легких, что соответствует текущему пониманию COVID-19. В 5ом релизе мы сообщаем о 15 регионах с полногеномной значимостью: 1 хромосомный регион имел полногеномную значимость только в анализе критического течения заболевания (анализ A); 11 регионов имели более сильный эффект в анализе тяжести заболевания, нежели в анализе инфицированности (анализ B); 4 региона были специфичны для анализа сообщенной перенесенной болезни (анализ C). На Рисунке 3 результаты представлены в виде Майами-графика (панельной версии Манхеттен-графика; такое название график получил из-за сходства с пейзажен, на котором небоскребы отражаются в воде).

Рисунок 3. Майами-график результатов GWAS для COVID-19. Верхняя панель отображает результаты сравнения госпитализированных с COVID-19 против контролей (анализ B), а нижняя панель содержит результаты сравнения людей, перенесших COVID-19 (в том числе, на основании анкетных данных) и контролей (анализ C).

Разнообразие когорт

Мы понимаем, что разнообразие исследуемых когорт играет одну из важных ролей (подробнее здесь). Поэтому мы старались увеличивать разнообразие участников исследование по мере увеличения количества и размеров когорт (Рисунок 4). Улучшения в подходе к сбору образцов привели нас к возможности обнаруживать новые генетические факторы, ассоциированные с COVID-19 (смотрите наши предыдущие посты в блоге по релизу 3 и релизу 4). Проведенный анализ позволил нам выявить генетические варианты, которые находятся непосредственно в генах или рядом с ними. Большинство генов, которые мы обнаружили таким образом, оказались связаны с клеточными механизмами, иммунной регуляцией и функционированием сердечно-сосудистой системы. Эта информация может быть полезна при разработке новых методов лечения.

Рисунок 4. Участники консорциума COVID-19 HGI, предоставившие данные для исследования и популяционный состав когорт, участвовавших в мета-анализе. В 5ом релизе учствовало 19 исследований, которые предоставили данные по неевропейским популяциям: 7 афроамериканских, 5 смешанно-американских, 4 восточноазиатских, 2 южноазиатских, 1 арабская. Ромбы иллюстрирует эффективный размер соответствующей когорты и географические координаты исследования.

Мы обнаружили 9 новых хромосомных регионов, ассоциированных с COVID-19. В анализе A (критическое течение заболевания) был выявлен регион рядом с геном LZTFL1 на третьей хромосоме и регион рядом с геном TAC4 на хромосоме 17. Белок LZTFL1 регулирует транспортировку белков к мембране цилии. Цилии (реснички) — это волосковидные структуры на поверхности клеток. Они встречаются в дыхательных путях, легких и многих других органах. LZTFL1 также участвует в иммунном ответе. Белок TAC4 связан с функциями регуляции кровяного давления и иммунной системы.

В анализе B (госпитализированные с COVID-19) мы обнаружили ассоциированные генетические варианты вблизи 4х генов. Во-первых, мы выявили хромосомный регион в THBS3 на хромосоме 1. Этот ген кодирует белок THBS3, который экспрессируется в сердце и имеет повышенный уровень экспрессии во время сердечно-сосудистых заболеваний. Во-вторых, мы обнаружили хромосомный регион в SCN1A на хромосоме 2. Варианты в гене SCN1A могут приводить к эпилепсии и судорогам. В-третьих, мы выявили регион в TMEM65 на хромосоме 8. Этот ген кодирует белок TMEM65, который играет роль в развитии сердца, регуляции сердечной проводимости и функции. Он может быть связан с тем, как клетка метаболизирует энергию. Следует отметить, что обнаруженный генетический вариант в TMEM65 имеет частоту 12% в Восточной Азии и 1% в европейской популяции. Частота аллеля количественно описывает вариабельность в данном гене или регионе. Наконец, мы выявили хромосомный регион в KANSL1 на хромосоме 17. Предполагается, что белок KANSL1 влияет на нейронные процессы.

Наконец, в анализе C, где в качестве больных рассматривались те, кто сообщил, что перенес коронавирусную инфекцию, было найдены 3 новые ассоциации в регионах близких к генам: ZBTB11 на хромосоме 3, DNAH5 на хромосоме 5 и PPP1R15A на хромосоме 19. Во-первых, мы обнаружили ассоциированный регион рядом с геном ZBTB11 на хромосоме 3. Этот ген кодирует белок ZBTB11, который регулирует развитие клеток иммунной системы. Во-вторых, мы выявили регион в DNAH5 на хромосоме 5. Генетические варианты в DNAH5 ранее показывали ассоциацию с синдромом Картагенера, нарушением подвижности цилий, приводящим к повторным инфекциям в грудной клетке, симптомам в ушах и носоглотке, бронхиту и бесплодию. Наконец, мы обнаружили регин вблизи PPP1R15A на хромосоме 19. Этот ген кодирует белок PPP1R15A, который влияет на остановку роста и смерть клеток в ответ на повреждение ДНК и неправильную структуру белка.

Согласно нашему анализу гены, вовлеченные в иммунную систему человека, играют важную роль в отношении COVID-19. Кроме того, значимую ассоциацию показали гены, связанные с функционирование легких и сердца, а также нейронных процессов. Ранее уже было показано, что сердечно-сосудистые заболевания являются фактором риска COVID-19, а нейронные симптомы встречаются при COVID-19.

Корреляция не означает причинно-следственную связь

Факторы риска, выявленные в ассоциативных исследованиях, не обязательно являются именно теми факторами, которые непосредственно повышают риск заболеваемости и тяжелого течения COVID-19. Поэтому мы решили использовать метод менделевской рандомизации, чтобы с помощью генетической информации детектировать причинно-следственные связи. MR — это метод, который использует генетические варианты, ассоциированные с некоторым признаком (например, ИМТ), чтобы проверить, влияет ли этот признак на заболевание. Более подробно мы описывали MR в нашем предыдущем посте (ориентирован на научную аудиторию). Среди трех COVID-19 фенотипов мы обнаружили статистически значимую каузальную ассоциацию между тремя COVID-19 исходами и 6 признаками (из 38, которые были протестированы, Рисунок 4). Было показано, что генетически предсказанный индекс массы тела (ИМТ) был ассоциирован с более высоким риском инфицирования SARS-CoV-2 и госпитализацией с COVID-19. Эти результаты подтверждают предыдущие находки исследований, в которых повышенный риск тяжелого течения COVID-19 было ассоциирован с более высоким ИМТ. Кроме того, генетически предсказанный статус курения был ассоциирован повышенным риском госпитализации с COVID-19.

Рисунок 5. Генетические корреляции и оценки причинно-следственных связей с помощью менделевской рандомизации между 38 признаками и заболеваемостью и тяжестью COVID-19. На оси X располагаются признаки, на оси Y — фенотипы COVID-19. Голубой цвет означает отрицательную генетическую корреляцию и протективный эффект в менделевской рандомизации, а красный цвет означает положительную генетическую корреляцию и повышающий риск эффект в менделевской рандомизации. Оценки, которые достигли статистического уровня значимости, отмечены звездочками.

Глобальная инициатива по изучению генетики COVID-19

В контексте текущего глобального кризиса из-за пандемии COVID-19 результаты этого проекта демонстрируют возможности, возникающие при объединении усилий 47 научных коллективов. Всего нам удалось выявить 15 геномных региона, ассоциированных с заболеваемостью и тяжестью COVID-19. Для определения каузальности этих регионов мы использовали статистические методы (в частности, менделевскую рандомизацию) и детектировали 8 признаков, которые статистически значимо каузально связаны с COVID-19 GWAS сигналами. В текущий момент мы оформляем наши результаты в виде научной статьи. По мере того, как мы будем продолжать сражаться с пандемией COVID-19, новые генетические результаты будут публиковаться в рамках COVID-19 HGI. Работая совместно, мы сможем получить достоверные результаты, которые помогут в понимании биологических факторов и клинических проявлений COVID-19.

Благодарности

Благодарим Andrea Ganna, PhD, за полезные комментарии.