This is a translation in Korean. You can also read the original English version.
September 25, 2020
코로나19 환자유전학이니셔티브를 대표하여 Brooke Wolford 와 Kumar Veerapen 글 작성
한글 번역: 임호균, 한철호, 송한,임지우, 이윤미, 김수경
주의사항: 첫째, 본 연구는 현재 진행 중입니다. 과학자들이 연구를 통해 이미 새로운 사실들을 발견하고 있지만, 환자의 유전형이 COVID-19 감염 증상에 어느정도 기여하는지에 대한 연관성을 명확히 이해하기 위해 더 많은 환자 샘플이 필요합니다. 본 연구에 더 많은 샘플 데이터가 추가 될수록 연구에서 밝혀낸 결과의 신뢰도가 높아지며 여러 환자군에서 대표성을 띄는 결과임을 확신 할 수 있습니다. 둘째, 개인의 유전형에 따라 확율적으로 어떤 COVID-19 감염 증상을 보일지 단정 지을 수 없습니다. 본 연구 결과를 활용하고자 하는 이는 환자의 유전형에 따른 COVID-19 환자 진단에 이 결과를 사용해서는 안 되며, 항상 전문가와 상담을 통해 의료적 선택을 안내받아야 합니다. 마지막으로 본문에서 사용되는 어휘가 생소하다면 hgi-faq@icda.bio 로 메일을 보내주시기 바랍니다. 더 명확한 정보를 제공하기 위해 본문의 정보를 업데이트 할 수 있도록 하겠습니다. 향후 지속적으로 개념이나 용어를 추가적으로 설명하는 정보가 제공 될 예정입니다. 그 사이에, 유전학의 기초를 검토하려면 이 자료를 보시길 권장합니다.코로나바이러스감염증-19 (COVID-19)는 전 세계 인구의 일상생활에 영향을 주고있습니다. 전 세계 과학자들은 코로나19바이러스 (SARS-CoV-2)와 그 감염증을 이해하기 위해 연구에 매진하고 있습니다. 코로나19 환자유전학이니셔티브 (COVID-19 Host Genetic Initiative, HGI) 는 이러한 연구 그룹 중 하나로 세계 곳곳의 유전학자들로 구성되어 있습니다. 본 그룹은 코로나19바이러스 감염과 감염증(COVID-19)이 감염자의 유전형질에 따라 어떠한 영향을 받는지 알아내는데 초점을 두고 있습니다. 특히 DNA에 존재하는 어떤 유전형질이 코로나19 감염증의 발병에 영향을 주는지, 더 나아가 감염자들의 증상과 어떠한 관련이 있는지를 밝혀내고자 합니다.
본 연구에서는, 입원한 코로나19바이러스 양성 환자들의 유전형과 코로나바이러스 감염증(COVID-19) 증상이 없는 일반 인구의 유전형을 비교하고 있습니다. 이러한 비교분석 방법을 전체유전체 상관분석 연구 또는 GWAS(Genome Wide Association Study) 라고 합니다. GWAS에 대한 자세한 설명은 이 영상 또는 인포그래픽을 참조하세요! 2020년 7월 현재 연구단은 8개의 다른 연구로부터 총 3,199건의 양성 샘플과 89만 7,488건의 대조군을 종합 분석한 결과를 발표하였습니다.
위 그림 1은 코로나19 환자유전학이니셔티브의 최근 연구결과를 시각적으로 요약한 것입니다. 이런 시각화 방식을 맨해튼플랏이라고 하며, 이 기법에 대한 설명은 각주를 참조해 주시기 바랍니다. 맨해튼플랏은 전유전체에 걸쳐 형질(예: COVID-19)과 유전형 사이의 연관성을 시각화하는 데 사용됩니다. 연구단은 3번 염색체에서 통계적으로 유의한 영역을 발견하였습니다 (가로축에 표시된 3번 염색체 위에 수직으로 표시된 점선들). 이런 지역은 서로 가까이 위치한 다수의 유전자가 포함된 넓은 지역일 수 도 있습니다. 통계적으로 유의미한 넓은 염색체 영역에서 COVID-19 중증도와 정말로 연관이 있는 특정 유전자를 밝혀내기 위해서는 추가적인 연구가 필요합니다. 이번 연구를 통해 밝혀진 3번 염색체 지역은 다수의 유전자가 위치한 지역입니다 (그림 2 에 열거된 모든 유전자 참조). 이 지역에 포함된 여러 유전자 중 어떤 유전자가 COVID-19 중증도와 관련이 있는지는 밝혀지지 않았습니다. 하지만, 연구단은 몇 가지 흥미로운 단서를 발견하였습니다! 이 지역에는 CXCR6, CCR1과 같은 여러 케모카인 관련 유전자가 있습니다. 케모카인은 면역세포들의 이동을 조절하며 선천적 면역체계의 정상적인 기능에도 중요한 것으로 알려져 있습니다. 그중 SLC6A20 유전자가 이 지역에 위치하며, 이 유전자가 만드는 단백질은 ACE2와 결합하는 것으로 알려져있습니다. ACE2 단백질은 코로나19바이러스가 숙주 세포내로 들어가기 위해 사용하는 문과 같은 단백질입니다 (그림 3). 이 결과는 SLC6A20 유전자 변이가 바이러스 유입에 영향을 미친다는 것을 의미합니다! 연구단의 이러한 유전적 연관성 발견은 연구의 첫 단계 일 뿐입니다.
뉴스를 통해 혈액형이 코로나19 감염증과 관련이 있으며 A 혈액형의 경우 높은 위험도를, O 혈액형의 경우 낮은 위험도를 가진다는 소식을 접해 보셨을 수 있습니다. 최근 NEJM (New England Journal of Medicine) 에 발표된 논문에서 1,980명의 이탈리아, 스페인의 중증 코로나19 환자 (예: 호흡기 장애로 입원)에 대한 유전자 연관 분석 결과 (23andMe에 의해서도 반복 연구됨)를 발표했습니다. 이 연구에서 9번 염색체의 ABO 혈액형 유전자군이 COVID-19와 관련성이 있는 것으로 발표되었습니다. 그러나, 이 연구에서 헌혈자들을 분석 대조군으로 사용했고, 헌혈자들중 O형이 더 많이 포함되는 경향이 있어, COVID-19 감염 환자와 비교하기에 적합하지 않을 수도 있습니다. 이러한 사실은 본 연구단의 데이터를 통해 확인할 수 있습니다: 그림 1의 맨해튼플랏에서 9번 염색체 위에 통계적으로 유의미한 결과(즉, 빨간 선 위로 솟아오르는 점)를 볼 수 없습니다. 이는 NEJM의 연구 데이터를 포함하는 코로나19 환자유전학이니셔티브의 연구에서는 코로나19 감염증과 ABO 혈액형 유전자군이 연관성을 보이지 않음을 의미합니다. 이 유전자들이 COVID-19와 관련이 있는지 여부를 명확히 하기위해서는 더 많은 샘플들이 필요합니다.
어떤 연구도 완벽하지 않기 때문에 본 연구의 몇 가지 한계를 명확히 하려고 합니다. 첫째, 위에서 설명한 결과는 현재 진행중인 분석의 중간 결과로 2020년 7월까지 제출된 데이터에 기반한 것입니다. 연구단은 초기 분석을 할 수 있을 정도의 샘플 데이터를 가지고 있지만, 앞으로 추가되는 샘플 데이터의 크기가 커짐에 따라 진행되는 분석 결론의 신뢰도는 증가 할 것 입니다. 샘플 크기가 크다는 것은 유감스럽게도 더 많은 사람들이 COVID-19에 감염되었다는 것을 의미하지만, 동시에 인간의 유전형과 질병의 증상 및 예후 사이의 규칙을 찾는 연구의 성공률도 향상시킬 수 있습니다.
둘째, 질병의 중증도에 대한 정의는 각각의 연구마다 상이할 수 있습니다. 또한, 대조군 샘플은 COVID-19가 없는 것으로 추정하지만, 지역사회에 무증상 감염자가 존재하기 때문에, "대조군 샘플" 중 일부는 실제로 COVID-19에 감염되었을 수 있습니다. 하지만 이러한 한계점은 환자군과 대조군의 수를 확대함으로써 극복할 수 있습니다. 즉, 더 많은 샘플을 분석할수록 연구 설계의 한계로 인한 위양성 신호를 관찰할 가능성이 낮아집니다. 정확한 양성 신호가 확인되면, 이러한 발견에 대해 더 구체적인 정의가 되어 있는 개별 연구의 사례군과 대조군에 대한 연구를 통해 양성 결과를 검증할 수 있습니다. 결론적으로, 본 연구를 통해 발견된 유전적 정보를 이용하여 질병 메커니즘에 대한 통찰력을 얻기 위해서는 추가적인 연구가 필요합니다.
샘플의 규모에 관련된 문제를 해결하기 위해, 연구단은 공동 연구단체들로부터 샘플 데이터를 지속적으로 받고 있습니다. 다음 분석은 9월 말 수행되며 그 결과는 2020년 10월 초에 발표될 예정입니다. 다음 분석결과에서는 기존보다 최대 50% 더 많은 표본 크기를 사용할 예정이며 이를 통해 더욱 다양한 결과를 도출해 낼 수 있을 것으로 기대하고 있습니다. 또한 COVID-19 환자 증상과 관련하여 더욱 상세하고 방대한 정보를 수집할 수 있을 것으로 기대하고 있습니다. 2020년 10월 분석에서 추가적으로 발견된 결과들에 대해서 향후 본 사이트에서 확인할 수 있습니다.
본 연구단에서 제공하는 초기 연구결과들을 통해 더욱 정밀한 연구들이 진행될 예정입니다. 연구단을 비롯한 다양한 연구자들이 본 연구를 이어갈 것이며, 이를 통해 유전자 변이가 세포에 영향을 주는 생물학적 과정과 이러한 변화가 COVID-19 감염이후 증상과 어떤 관련이 있는지 밝혀낼 수 있을 것입니다. 후속 연구에 대해 더 자세한 내용을 알고자 하시면 이 링크를 참조해 주시기 바랍니다. 이러한 연구의 일환으로, 밝혀진 유전적 변이가 중증 입원 환자들의 예후와 어떠한 연관성을 지니는지 밝히는 것이 있습니다. 연구단은 협업에 의해 발견된 유전적 결과에 대해 더 깊은 이해 할 수 있기를 바라며 이를 통해 COVID-19 환자들의 더 나은 임상 관리와 질병 치료로 이어질 수 있기를 바랍니다.
COVID-19 Host Genetics Initiative에 대한 추가정보는 다음 언론 기사를 확인하십시오.
Rachel Lao, Caitlin Cooney, CGC, Karen Zusi, Andrea Ganna, Alina Chan, Sophie Limou, Shea Andrews, Jamal Nasir님께 사려 깊은 검토와 수정 의견에 감사드립니다. 지놈오피니언의 임호균, 한철호, 임지우, 송한, 이윤미, 김수경님께 번역, 검토와 수정 의견에 감사드립니다.
맨해튼플랏(그래프가 뉴욕시의 스카이라인처럼 보여서 붙은 이름)은 GWAS 결과를 나타낼 때 흔히 볼 수 있습니다. 가로축 또는 X축("염색체")은 23개 염색체에 걸친 유전변이의 위치를 표시합니다 (인간은 22쌍의 염색체에 X와 Y 성염색체를 특정 조합으로 가지고 있습니다). 세로축 또는 Y축은 p-값이라고 불리는 통계적 유의성을 표시하며 그래프에는 음의 상용로그값을 취한 후 표시합니다. 그림의 각 점은 환자군과 대조군의 모든 개인의 특정 염색체 위치(SNP, "스닙"으로 발음)의 유전적 변이와 질병과의 연관성에 대한 통계적 유의성(p-값)을 표시합니다. 점이 Y축에서 높은 수치일수록 이 SNP이 관심 질병 증상(예: COVID-19 중증도)과 연관될 가능성이 높습니다. 연구단은 분석을 위해 보수적인 방법을 사용였습니다: 많은 연구들이 통계적으로 유의미하다고 간주하기 위해 0.05 미만의 p-값을 요구하는 반면, 본 연구는 발견에 대한 신뢰도를 향상시키기 위해 0.00000005 (빨간 선으로 표시) 미만의 p-값을 요구합니다. 그래프에 점이 빨간색 선보다 높으면 유전적 연관성이 "통계적으로 유의하다"고 간주하므로 SNP의 생물학적 관련성을 추가로 검증하고 이해하기 위한 실험을 설계할 수 있습니다.