Nvidia finalise un accord de 20 milliards de dollars avec Groq et dévoile la technologie LPU au GTC 2026

15:04, 16 mars

Édité par : Aleksandr Lytviak

iframe { display: none; }

Nvidia finalise un accord de 20 milliards de dollars avec Groq et dévoile la technologie LPU au GTC 2026

Nvidia a conclu en décembre 2025 un accord de licence majeur avec la start-up de puces d'intelligence artificielle Groq, une transaction dont la valeur est estimée à près de 20 milliards de dollars. Cet arrangement, qui représente la plus importante transaction de l'histoire de Nvidia, surpassant l'acquisition de Mellanox en 2019 pour environ 7 milliards de dollars, incluait une opération d'acqui-hire pour intégrer des talents clés. Jonathan Ross, fondateur de Groq et figure ayant contribué à la conception de l'Unité de Traitement Tensorielle (TPU) de Google, rejoint Nvidia pour diriger une nouvelle division axée sur l'inférence en temps réel.

L'accord a été structuré comme une licence non exclusive de la propriété intellectuelle de Groq, permettant à GroqCloud de maintenir ses opérations en toute indépendance. Groq se positionne sur l'inférence IA rapide et efficiente, essentielle pour l'application en temps réel des modèles entraînés. Cette orientation stratégique répond à la réorientation des dépenses en capital des géants technologiques vers le service direct des utilisateurs finaux dans le domaine croissant de l'économie de l'inférence.

La technologie de Groq repose sur ses Unités de Traitement Linguistique (LPU), qui exploitent la mémoire SRAM sur puce au lieu de la mémoire à haute bande passante (HBM) utilisée par les GPU conventionnels. Cette architecture confère à la puce LPU une bande passante interne d'environ 80 téraoctets par seconde, contrastant avec les 8 téraoctets par seconde des GPU haut de gamme équipés de HBM. Cette conception vise à contourner le goulot d'étranglement de la mémoire, souvent appelé le « mur de la mémoire », qui limite la performance des GPU lors de la génération séquentielle de jetons.

Dans un marché de l'inférence de plus en plus compétitif, où Google et Amazon développent leurs propres puces pour défier la part de marché de Nvidia, estimée entre 80 % et 90 %, l'intégration de la propriété intellectuelle de Groq est perçue comme une manœuvre pour sécuriser l'avantage de Nvidia. L'investissement de 20 milliards de dollars, financé par environ trois mois de flux de trésorerie disponible de Nvidia, qui s'élevait à 22,1 milliards de dollars au troisième trimestre de l'exercice 2026, souligne l'importance stratégique de cette technologie pour l'avenir de l'IA temps réel. Le marché mondial des puces IA, évalué à 30 milliards de dollars en 2024, devrait atteindre 341 milliards de dollars en 2033.

Nvidia s'apprête à dévoiler un produit exploitant la technologie LPU de Groq lors de la conférence GTC 2026, qui débutera le 16 mars 2026 à San Jose. Cette nouvelle puce, potentiellement intégrée à l'architecture « Vera Rubin » prévue pour fin 2026, est conçue pour exceller dans l'inférence, offrant potentiellement un gain d'efficacité d'un facteur dix par rapport aux solutions actuelles. L'architecture LPU, par son exécution déterministe et l'usage de la SRAM sur puce, garantit une latence en microsecondes pour les charges de travail IA séquentielles.

NVIDIA