El modelo de inteligencia artificial Evo 2, publicado en la revista Nature, es descrito como el sistema biológico de IA más grande jamás creado. Su ambición es extraordinaria: comprender y diseñar el código genético en todos los dominios de la vida.

Entrenado con 9,3 billones de nucleótidos procedentes de 128.000 genomas (bacterias, arqueas, virus, plantas, animales y humanos), el modelo es capaz de identificar patrones evolutivos invisibles para el análisis humano convencional.
¿Qué es exactamente Evo 2?
Evo 2 es un foundation model biológico, similar en concepto a los grandes modelos lingüísticos, pero en lugar de aprender del texto de internet, aprende del ADN.
Si los LLM predicen palabras, Evo 2 predice:
- Mutaciones genéticas
- Funciones biológicas
- Interacciones entre regiones distantes del genoma
- Nuevas secuencias sintéticas viables
Procesa hasta un millón de nucleótidos simultáneamente, lo que permite analizar relaciones complejas dentro de un mismo genoma.
Del mamut a la bacteria: un modelo universal
El proyecto amplía el trabajo previo con Evo 1, que se centraba en organismos unicelulares.
Evo 2 integra datos de todo el árbol de la vida y fue entrenado durante meses en la plataforma NVIDIA DGX Cloud, utilizando 2.000 GPU H100.
La arquitectura empleada, denominada StripedHyena 2, fue rediseñada para manejar secuencias extremadamente largas con mayor eficiencia.
Según Patrick Hsu, cofundador del Arc Institute:
“Por primera vez, las máquinas pueden leer, escribir y razonar en el lenguaje de los nucleótidos”.
Pruebas en enfermedades humanas
Uno de los experimentos clave fue el análisis de variantes del gen BRCA1, asociado al cáncer de mama.
Resultados:
- ✔️ Más del 90 % de precisión
- ✔️ Clasificación correcta entre mutaciones benignas y potencialmente patógenas
También se ha aplicado a estudios sobre riesgo genético en Alzheimer.
Esto podría:
- Reducir años de experimentación en laboratorio
- Acelerar el desarrollo de fármacos
- Mejorar la identificación de causas genéticas de enfermedades raras
Diseño genético a medida
Más allá de analizar ADN existente, Evo 2 puede diseñar genomas completos, tan largos como los de bacterias simples.
Aplicaciones potenciales:
- Terapias génicas más precisas
- Secuencias reguladoras que activen tratamientos solo en ciertos tejidos
- Biología sintética avanzada
- Ingeniería metabólica
El equipo compara el modelo con un “sistema operativo biológico” sobre el que otros investigadores podrán construir aplicaciones.
Acceso abierto… con cautela
En un movimiento poco habitual para un modelo de esta escala, el equipo ha publicado el código y los datos en GitHub.
Sin embargo, se aplicaron restricciones importantes:
- Exclusión de patógenos humanos del entrenamiento base
- Bloqueo de generación de secuencias relacionadas con organismos peligrosos
- Supervisión ética especializada
¿Estamos ante un punto de inflexión?
Evo 2 representa un cambio de paradigma:
La biología deja de ser solo una ciencia observacional para convertirse en una disciplina generativa, donde la IA no solo analiza la vida, sino que ayuda a diseñarla.
La gran pregunta ya no es solo qué mutaciones puede detectar.
Es qué nuevas formas biológicas —naturales o sintéticas— podrían surgir a partir de este dominio computacional del código genético.



