Resumen
- El síndrome respiratorio agudo severo coronavirus tipo 2 (SARS-CoV-2) es el agente etiopatogénico del COVID-19, condición que ha llevado a una pandemia formalmente reconocida en marzo de 2020 (Organización Mundial de la Salud –OMS). El genoma del SARS-CoV-2 está constituido por 29.903 pares de bases, que codifican cuatro proteínas estructurales (N, M, S y E) y más de 20 proteínas no estructurales. Mutaciones en cualquiera de estas regiones, especialmente en aquellas que codifican para las proteínas estructurales, han permitido identificar diversos linajes en todo el mundo, algunos de ellos denominados Variantes de Preocupación (VOC) y Variantes de Interés (VOI), según el OMS y CDC. En este estudio, utilizando la tecnología Next Generation Sequencing (NGS), secuenciamos el genoma del SARS-CoV-2 de 422 muestras de residentes en Colombia, todas recolectadas entre abril de 2020 y enero de 2021. Obtuvimos información genética de 386 muestras, lo que llevó nos llevó a la identificación de 14 nuevos linajes circulantes en Colombia, 13 de los cuales fueron identificados por primera vez en Sudamérica. GH fue el clado GISAID predominante en nuestra muestra. La mayoría de las mutaciones fueron sin sentido (53,6%) o mutaciones sinónimas (37,4%), y la mayoría de los cambios genéticos se localizaron en elORF1ab(63,9%), seguido del gen S (12,9%). En este último identificamos las mutaciones E484K, L18F y D614G. La evidencia reciente sugiere que estas mutaciones confieren importantes particularidades al virus , comprometiendo la inmunidad del huésped, el rendimiento de las pruebas de diagnóstico y la eficacia de algunas vacunas. Algunos linajes importantes que contienen estas mutaciones son Alfa, Beta y Gamma (Etiqueta de la OMS). Es importante una mayor vigilancia genómica para comprender las variantes genómicas emergentes y su correlación con la gravedad de la enfermedad.
- The severe acute respiratory syndrome coronavirus type 2 (SARS-CoV-2) is the etiopathogenic agent of COVID-19, a condition that has led to a formally recognized pandemic by March 2020 (World Health Organization –WHO). The SARS-CoV-2 genome is constituted of 29,903 base pairs, that code for four structural proteins (N, M, S, and E) and more than 20 non-structural proteins. Mutations in any of these regions, especially in those that encode for the structural proteins, have allowed the identification of diverse lineages around the world, some of them named as Variants of Concern (VOC) and Variants of Interest (VOI), according to the WHO and CDC. In this study, by using Next Generation Sequencing (NGS) technology, we sequenced the SARS-CoV-2 genome of 422 samples from Colombian residents, all of them collected between April 2020 and January 2021. We obtained genetic information from 386 samples, leading us to the identification of 14 new lineages circulating in Colombia, 13 of which were identified for the first time in South America. GH was the predominant GISAID clade in our sample. Most mutations were either missense (53.6%) or synonymous mutations (37.4%), and most genetic changes were located in the ORF1ab gene (63.9%), followed by the S gene (12.9%). In the latter, we identified mutations E484K, L18F, and D614G. Recent evidence suggests that these mutations concede important particularities to the virus, compromising host immunity, the diagnostic test performance, and the effectiveness of some vaccines. Some important lineages containing these mutations are the Alpha, Beta, and Gamma (WHO Label). Further genomic surveillance is important for the understanding of emerging genomic variants and their correlation with disease severity.