Avec Evo-2, l’IA plonge au cœur du vivant et réécrit les règles de la génomique. De la détection de mutations à la conception de nouvelles molécules, ce modèle hors norme est un véritable outil d’analyse et de prédiction pour explorer le code génétique.
Et si l’on apprenait aux IA le code ADN comme on lui apprend les mots d’une langue ? C’est de cette idée qu’est né Evo-2, le plus grand modèle d’intelligence artificielle dédié à l’analyse du code génétique. Fruit d’une collaboration entre l’Arc Institute, Stanford University et NVidia, ce nouvel outil s’appuie sur la puissance du DGX Cloud et de 2 000 GPUs H100 pour traiter des volumes de données sans précédent.
Entraîné sur près de 9 trillions de nucléotides issus de 128 000 génomes couvrant l’ensemble du règne vivant – des bactéries aux plantes en passant par les animaux – Evo-2 offre une vision inédite de la complexité biologique. Grâce à une architecture novatrice capable de gérer jusqu’à un million de bases consécutives, le modèle déchiffre non seulement les séquences codantes, mais également les régions non codantes qui régulent l’activité génétique.
En théorie, une telle capacité doit notamment permettre de prédire la forme et la fonction des protéines, d’identifier de nouvelles molécules à vocation thérapeutique ou industrielle, et d’évaluer l’impact de mutations génétiques sur la santé.
« Evo-2 marque un tournant dans la génomique générative, ouvrant la voie à des solutions en santé et en environnement aujourd’hui inimaginables, » explique Patrick Hsu, cofondateur de l’Arc Institute et professeur à l’Université de Californie, Berkeley.
Publiée sous forme de microservice NVidia NIM personnalisable mais également en open source via le framework NVidia BioNeMo, cette nouvelle IA n’est pas figée et ses créateurs encouragent désormais la communauté scientifique à explorer et adapter l’outil à leurs besoins spécifiques.
Au-delà de ses applications en recherche fondamentale, Evo-2 suscite de grandes attentes dans des domaines variés. En santé, il pourrait permettre par exemple d’anticiper l’effet de mutations dans des gènes associés à des maladies comme le cancer, avec une précision qui peut atteindre 90 % si l’on se fie aux premiers tests réalisés sur le gène BRCA1. En agriculture, il ouvre la voie à la création de variétés de cultures plus résistantes et nutritives, tandis que dans l’industrie, il pourrait contribuer au développement de bioénergies ou à la dégradation de substances polluantes.
Avec Evo-2, les scientifiques disposent d’une sorte de « télescope » numérique prédictif capable d’explorer les moindres recoins du génome et d’anticiper ces évolutions. « La vie trouve toujours son chemin… »(*) et désormais, l’IA peut même le prédire.
(*) Ian Malcom, Jurassic Park