Dans une avancée révolutionnaire à l'intersection de l'intelligence artificielle et de la biologie moléculaire, une équipe dirigée par Thomas Hayes a conçu une nouvelle protéine fluorescente en utilisant le modèle de langage génératif multimodal ESM3. Cette innovation simule des processus évolutifs s'étendant sur 500 millions d'années, offrant des aperçus profonds des systèmes biologiques et des applications potentielles des protéines nouvellement créées en médecine, bio-ingénierie et science environnementale.
ESM3 diverge des modèles traditionnels en raisonnant sur les séquences, structures et fonctions des protéines, permettant une exploration détaillée des caractéristiques des protéines à travers des jetons discrets élaborés. Cette approche permet aux scientifiques de créer des fonctionnalités protéiques sur mesure, révolutionnant potentiellement la biologie synthétique et les biopharmaceutiques.
La formation du modèle a englobé un ensemble de données impressionnant de 771 milliards de jetons uniques, tirés de 3,15 milliards de séquences protéiques distinctes. Cette base extensive permet à ESM3 de générer des séquences protéiques sans précédent, remettant en question les compréhensions actuelles de l'évolution des protéines.
Avec une architecture évolutive dotée de 98 milliards de paramètres, ESM3 discerne des relations biologiques complexes, simulant des millions d'années d'adaptation évolutive pour générer des protéines avec des propriétés uniques. La nouvelle protéine fluorescente synthétisée présente une luminosité remarquable, suggérant des avantages dans des applications basées sur la fluorescence telles que l'imagerie et le diagnostic.
Dans un mouvement significatif vers l'accessibilité, ESM3 lancera une phase bêta publique via une API, permettant aux chercheurs du monde entier d'utiliser ses capacités de modélisation avancées. Cette démocratisation favorise la recherche collaborative, permettant aux scientifiques d'ingénier des protéines avec des outils conviviaux.
L'API EvolutionaryScale Forge propose un niveau gratuit dédié à l'accès académique, favorisant l'innovation dans l'ingénierie des protéines. Le code et les poids du modèle ouvert servent de ressources précieuses pour les biologistes computationnels, garantissant une recherche continue robuste.
Alors que nous entrons dans une nouvelle ère de la biologie synthétique, les contributions d'ESM3 illustrent comment l'IA peut transformer les méthodologies de recherche traditionnelles, impactant des secteurs allant des soins de santé à la science environnementale. La communauté scientifique est encouragée à tirer parti de cette technologie pour relever des défis réels, avec un potentiel de découverte illimitée en biochimie.
La création d'une nouvelle protéine fluorescente grâce à ESM3 signifie un changement dans l'utilisation de l'IA pour manipuler les complexités de la biologie des protéines. Cette recherche incarne la convergence de la technologie et de la biochimie, annonçant l'aube de la biologie pilotée par l'IA et ses développements futurs prometteurs.