Google lance Gemini 3
Google lance Gemini 3, annonçant l'ère de la « Pensée Profonde » et des Agents Autonomes
Auteur : Veronika Radoslavskaya
Deux ans après le début de l'essor fulgurant de l'IA générative, Google a officiellement dévoilé Gemini 3. Ce modèle ambitieux prétend transformer le paysage, passant de simples chatbots prédisant du texte à de véritables agents d'IA capables de raisonner, de planifier et d'agir de manière autonome. Cette sortie se décline en deux niveaux principaux : Gemini 3 Pro, disponible immédiatement, et le mode plus puissant Gemini 3 Deep Think, qui est spécifiquement conçu pour aborder des problèmes complexes en effectuant une phase de « réflexion » approfondie avant de fournir une réponse.
La caractéristique la plus marquante de cette nouvelle génération réside dans son accent mis sur le « raisonnement mécaniste ». Le lancement immédiat de Gemini 3 Pro démontre des capacités de raisonnement de pointe, atteignant un score impressionnant de 91,9 % sur le difficile banc d'essai GPQA Diamond et de 37,5 % sur le test Humanity's Last Exam (HLE), le tout sans l'utilisation d'outils externes. Cette fiabilité élevée permet au modèle de saisir la profondeur et la nuance dans des domaines complexes comme la science et les mathématiques.
Le nouveau mode Deep Think, qui sera bientôt accessible aux abonnés Ultra, repousse ces limites encore plus loin. Conçu pour s'attaquer aux problèmes les plus complexes et inédits, Deep Think a obtenu un score de 45,1 % sur ARC-AGI-2, un test rigoureux qui évalue la capacité d'une IA à résoudre des énigmes logiques jamais rencontrées. Il a également atteint 41,0 % sur HLE. Ce mode amélioré est clairement orienté vers la résolution de problèmes authentique, allant bien au-delà de la simple récupération et synthèse d'informations standard.
Pour les développeurs, cette annonce s'accompagne du lancement d'une nouvelle plateforme nommée Google Antigravity. Cet environnement de développement « axé sur l'agent » permet aux ingénieurs logiciels de collaborer avec des agents d'IA ayant un accès direct aux terminaux, aux navigateurs et aux éditeurs de code. Plutôt que de simplement compléter une ligne de code, ces agents peuvent planifier, exécuter et valider de manière autonome des tâches logicielles complexes. Google décrit cette approche comme l'outil ultime pour le « vibe coding » — un style de programmation où le développeur se concentre sur l'intention créative de haut niveau, laissant l'IA gérer les détails de l'implémentation.
Du côté des utilisateurs finaux, Gemini 3 exploite ses capacités multimodales et une fenêtre de contexte massive d'un million de jetons. Cela lui permet de traiter des quantités de données considérables, l'équivalent de plus de 1 500 pages de texte ou de conférences vidéo entières. Grâce à cette puissance, il peut fonctionner comme un coach personnalisé : par exemple, le modèle peut analyser une vidéo d'un match de pickleball d'un utilisateur, identifier des défauts spécifiques dans sa technique et générer un plan d'entraînement sur mesure.
Pour les étudiants, Gemini 3 peut ingérer des articles universitaires ou de longs tutoriels vidéo et générer des supports d'étude interactifs, tels que des fiches de révision ou des visualisations, pour faciliter la maîtrise du matériel. Il est également capable de déchiffrer des recettes manuscrites et de les convertir en formats numériques utilisables, démontrant une polyvalence remarquable.
Google revendique par ailleurs sa domination sur les classements. Gemini 3 Pro a immédiatement pris la première place sur LMArena, un site de benchmarking participatif où les utilisateurs évaluent aveuglément les modèles d'IA, atteignant un score Elo de 1501. Cette ascension rapide perpétue l'héritage de son prédécesseur, Gemini 2.5 Pro, qui détenait auparavant ce classement très disputé. Le déploiement du modèle est en cours à travers l'écosystème Google, incluant l'application Gemini, Vertex AI et un nouveau « Mode IA » dans Google Search qui génère des simulations interactives à la volée. Bien que le mode « Deep Think » soit retenu pour les vérifications de sécurité finales, le modèle de base Gemini 3 Pro est opérationnel dès aujourd'hui, signalant que Google est prêt à mettre l'IA « agentique » entre les mains de millions d'utilisateurs.
Lisez plus d’actualités sur ce sujet :
Grok 4.1 d'xAI : L'Intelligence Artificielle d'Elon Musk Gagne en Humanité et en Créativité Visuelle
Un sondage Ipsos révèle que 97 % des auditeurs sont incapables de distinguer la musique générée par l'IA de celle créée par l'homme
OpenAI Ouvre la Voie à la Compréhension de l'IA grâce à la Recherche sur les Nouveaux Modèles Sparses
Avez-vous trouvé une erreur ou une inexactitude ?
Nous étudierons vos commentaires dans les plus brefs délais.
