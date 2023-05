Durante dos décadas, se contó con un genoma humano de referencia basado solo en unas pocas personas. Investigadores construyen una nueva versión que combina material genético de diversas partes del mundo.



Un genoma es el conjunto de instrucciones de ADN que ayuda a cada ser vivo a desarrollarse y funcionar. Las secuencias del genoma difieren ligeramente entre los individuos. En el caso de los humanos, los genomas de dos personas son más del 99 por ciento idénticos. Las pequeñas diferencias restantes contribuyen a la singularidad de cada persona y ofrecen, por ejemplo, información sobre la salud, ayudando a diagnosticar enfermedades y desarrollar tratamientos.

Para comprender estas diferencias genómicas, los científicos han creado sucesivas secuencias del genoma humano de referencia (llamado GRCh38) mediante fusiones digitales para usarlas como un ‘estándar’ con el cual comparar, lo que ayuda a alinear, ensamblar y estudiar otras secuencias de nuestro genoma.



A pesar de su importancia y continuas mejoras, GRCh38 presenta limitaciones a la hora representar la variabilidad de la especie humana, ya que consta de genomas de solo unas 20 personas, y la mayor parte de la secuencia de referencia es de solo una de ellas.

Ahora el Consorcio de Referencia del Pangenoma Humano (HPRC, por sus siglas en inglés) publica en la revista Nature una nueva y sofisticada colección de secuencias que mejora ese genoma ‘estándar’ y recoge una diversidad sustancialmente mayor de la que se disponía hasta ahora. Se trata de un novedoso pangenoma de referencia.

(Vea también: Graban misteriosos sonidos en la estratosfera de la Tierra)

Hasta el momento se ha presentado el primer borrador, que incluye secuencias genómicas de 47 personas de diversas partes del mundo y con ancestros diferentes (africanos, americanos, asiáticos y europeos), pero los investigadores pretenden aumentar ese número hasta 350 a mediados del año 2024. Como las personas llevamos los cromosomas en parejas, la referencia actual incluye 94 secuencias genómicas distintas y el objetivo es alcanzar 700 diferentes cuando acabe el proyecto.

Nuevas ‘letras’ en el ADN



Con respecto al genoma humano de referencia, el pangenoma añade 119 millones de pares de bases o ‘letras’ en el ADN y 1.115 duplicaciones de genes (mutaciones en las que se duplica una región de ADN que contiene un gen), y aumenta la cantidad de variantes estructurales detectadas en un 104 por ciento, lo que brinda una imagen más completa de la diversidad genética dentro del genoma humano.



“Desde que se publicó el borrador del primer genoma humano, múltiples proyectos han trabajado en mejorar su calidad e ir completando esta referencia (por ejemplo, con el reciente proyecto Telomere-to-Telomere, T2T). No obstante, una referencia única y lineal sigue sin modelar correctamente la diversidad genómica de nuestra especie, ya que existen múltiples variantes genómicas que no son comunes a todas las personas”, explicó a Sinc uno de los muchos autores que han participado en este trabajo, Santiago Marco Sola, de la Universidad Autónoma de Barcelona.



“La solución propuesta ha sido modelar una referencia no lineal que contenga las variaciones genómicas que existen en la población –aclara–, considerando la diversidad genómica de nuestra especie. Esto se denomina pangenoma y utiliza una estructura de grafo (o diagrama) para modelar las variaciones genómicas que se dan en diferentes individuos”.

(Le puede interesar: Historias del cosmos: ¡Luz, ciencia y acción!)

Con supercomputadores

Marco Sola, también adscrito al Barcelona Supercomputing Center (BSC-CNS), destaca que este proyecto no sería posible sin los supercomputadores: “Si la construcción de una referencia genómica lineal (como GRCh38) requiere alinear y ensamblar cientos de miles de millones de bases de ADN, la de una referencia pangenómica necesita procesar varios órdenes de magnitud más de información”.



En el superordenador MareNostrum 4 del BSC-CNS se han desarrollado métodos que luego se han incorporado al proyecto del pangenoma, aunque el cómputo y procesamiento de los resultados finales presentados ahora se han realizado en otras infraestructuras internacionales de supercomputación.

Aplicaciones

“La referencia del pangenoma humano nos permitirá representar decenas de miles de nuevas variantes genómicas en regiones del genoma que antes eran inaccesibles”, subraya el coautor e investigador Wen-Wei Liao, de la Universidad de Yale (EE. UU.), “y con ella podemos acelerar la investigación clínica, al mejorar nuestra comprensión del vínculo entre los genes y los rasgos de la enfermedad”.



“Todo el mundo tiene un genoma único, por lo que el uso de una sola secuencia genómica de referencia para cada persona puede generar inequidades en los análisis genómicos”, apunta el coautor Adam Phillippy, del Instituto Nacional de Investigación del Genoma Humano (NHGRI, parte de los National Institutes of Health de EE. UU.), desde donde se lidera este proyecto, “y, por ejemplo, predecir una enfermedad genética podría no funcionar tan bien para alguien cuyo genoma es más diferente del genoma de referencia”.

(Siga leyendo: Primer cinturón de radiación observado fuera del sistema solar)

De ahí la importancia del nuevo pangenoma. “Los investigadores básicos y los médicos que utilizan la genómica necesitan acceder a una secuencia de referencia que refleje la notable diversidad de la población humana. Esto ayudará a que la referencia sea útil para todas las personas, lo que ayudará a reducir las posibilidades de propagar las disparidades en la salud”, señala Eric Green, director del NHGRI.



“La creación y mejora de una referencia del pangenoma humano se alinean con el objetivo de nuestro instituto de luchar por la diversidad global en todos los aspectos de la investigación genómica, que es crucial para avanzar en el conocimiento genómico e implementar la medicina genómica de manera equitativa”, añade.



El trabajo de este consorcio internacional cuenta con un presupuesto de unos 40 millones de dólares durante cinco años, lo que incluye los esfuerzos para crear la referencia del pangenoma humano, mejorar la tecnología de secuenciación del ADN, operar un centro de coordinación, llevar a cabo actividades de divulgación y generar recursos para que la comunidad científica pueda utilizar esta nueva referencia.

Más noticias en EL TIEMPO