Paris, France - Meta a lancé V-JEPA 2, un modèle d'IA avancé, un « modèle mondial » conçu pour comprendre et prédire le monde physique.
Ce nouveau modèle open-source peut appréhender les environnements 3D et le mouvement des objets. Il représente une avancée significative par rapport aux grands modèles de langage, permettant à l'IA d'apprendre, de planifier et de prendre des décisions de manière plus humaine.
V-JEPA 2 est capable de reconnaître qu'une balle roulant hors d'une table va tomber. Il raisonne dans un espace « latent » simplifié pour comprendre comment les objets se déplacent et interagissent.
Le scientifique en chef de l'IA chez Meta, Yann LeCunn, a souligné la différence entre la compréhension du langage et celle du monde physique. Il a expliqué qu'un modèle mondial agit comme un jumeau numérique abstrait de la réalité, permettant à l'IA de prédire les conséquences de ses actions.
Meta investit massivement dans l'IA, avec un investissement prévu de 14 milliards de dollars dans Scale AI. L'entreprise se concentre sur l'IA pour rivaliser avec d'autres géants de la technologie comme OpenAI et Google.
V-JEPA 2 est destiné à être utilisé dans les robots de livraison et les voitures autonomes. Ces machines doivent comprendre leur environnement en temps réel pour la navigation.
D'autres entreprises développent également des modèles mondiaux. DeepMind de Google travaille sur Genie, qui peut simuler des jeux et des environnements 3D. Fei-Fei Li a levé 230 millions de dollars pour une startup appelée World Labs, axée sur les grands modèles mondiaux.