Google DeepMind dévoile AlphaGenome : une révolution de l'IA capable d'analyser l'ADN avec un contexte de 1 Mo

Édité par : Maria Sagir

L'équipe de recherche de Google DeepMind a franchi une étape majeure dans le domaine de la génomique computationnelle avec l'annonce de son nouveau modèle d'intelligence artificielle, baptisé AlphaGenome. Cette avancée technologique a fait l'objet d'une publication détaillée dans la prestigieuse revue Nature le 28 janvier 2026. La particularité de cet outil réside dans sa capacité inédite à traiter et analyser des séquences d'ADN atteignant jusqu'à un million de paires de bases (1 Mo), offrant ainsi une précision d'analyse sans précédent pour les chercheurs du monde entier.

AlphaGenome s'inscrit comme le successeur direct du modèle Borzoi, qui était limité à des séquences d'environ 500 000 paires de bases. En doublant la fenêtre contextuelle, cette nouvelle architecture permet de saisir des interactions régulatrices beaucoup plus étendues au sein du génome humain. L'architecture du modèle repose sur une structure U-Net sophistiquée qui intègre un encodeur pour la synthèse des données massives, un bloc transformeur dédié à la modélisation des dépendances à long terme, ainsi qu'un décodeur capable de restituer les résultats avec une résolution extrêmement fine, allant jusqu'à la paire de bases individuelle.

L'un des atouts majeurs d'AlphaGenome est sa polyvalence exceptionnelle, puisqu'il peut prédire simultanément les résultats de onze processus génomiques fondamentaux. Parmi ces fonctions, on retrouve notamment l'expression des gènes, l'accessibilité de la chromatine et le mécanisme d'épissage de l'ARN. Contrairement à son prédécesseur Borzoi, AlphaGenome identifie explicitement les sites d'épissage et leur utilisation réelle, fournissant des données bien plus granulaires sur les processus biologiques. Selon les auteurs de l'étude, le modèle surpasse les approches concurrentes dans la majorité des tests évaluant les conséquences fonctionnelles des variantes génétiques, notamment pour les tâches liées aux locus de caractères quantitatifs d'expression (eQTL).

Cette technologie promet d'accélérer considérablement l'identification des facteurs génétiques à l'origine de diverses pathologies et de favoriser le développement de nouvelles approches thérapeutiques. Elle permet en effet d'explorer plus profondément les régions non codantes du génome, qui représentent environ 98 % de l'ADN humain et abritent des éléments régulateurs cruciaux. De nombreux experts soulignent que de tels modèles transforment le code génomique « statique » en un langage dynamique propice aux découvertes scientifiques. Toutefois, il est précisé qu'AlphaGenome n'est pas encore destiné au diagnostic clinique direct ou à la prescription de traitements, car la prédiction fiable des variations d'expression génique chez des individus spécifiques reste un défi complexe pour l'IA actuelle.

Dans une optique de soutien à la communauté scientifique globale, le code source ainsi que les poids du modèle ont été mis à disposition en accès libre pour la recherche non commerciale. Une interface de programmation (API) a également été déployée pour faciliter l'intégration de l'outil dans les flux de travail quotidiens des laboratoires. Selon les développeurs, des milliers de scientifiques utilisent déjà ces ressources pour étudier les variantes régulatrices et les bases génétiques des maladies complexes. Pour les spécialistes de l'oncologie et de la génomique, ces approches jettent les bases d'une interprétation fonctionnelle exhaustive du génome, ouvrant la voie à des stratégies thérapeutiques de plus en plus ciblées et personnalisées.

13 Vues

Sources

  • GIGAZINE

  • Google DeepMind

  • IFLScience

  • SiliconANGLE

  • Science Media Centre

  • Science News

Avez-vous trouvé une erreur ou une inexactitude ?Nous étudierons vos commentaires dans les plus brefs délais.