27 janvier 2025 - DeepSeek, une startup chinoise d'IA, fait la une des journaux après le lancement de son nouveau modèle de langage, R1, le 20 janvier. Le modèle a rapidement grimpé au sommet du classement des applications gratuites de l'App Store d'Apple, surprenant les leaders de l'industrie à Silicon Valley.
Le R1 de DeepSeek est conçu pour résoudre des problèmes complexes et a été développé à un coût nettement inférieur par rapport aux modèles d'entreprises établies telles qu'OpenAI et Meta. La société a déclaré avoir construit et formé son modèle V3 pour moins de 6 millions de dollars en utilisant environ 2 000 puces Nvidia H800, moins puissantes que les puces H100 privilégiées par les entreprises américaines.
Malgré les limitations dues aux sanctions américaines empêchant l'accès à des puces avancées, les performances de DeepSeek sont remarquables. Les experts de l'industrie ont reconnu les avancées rapides de la startup, Marc Andreessen, un capital-risqueur de Silicon Valley, qualifiant le R1 de 'don profond au monde' et le comparant à un 'moment Sputnik' pour l'IA.
Le scientifique en chef de l'IA de Meta, Yann LeCun, a souligné l'importance des modèles open-source, déclarant que le succès de DeepSeek met en évidence les avantages de la recherche ouverte. Meta a récemment annoncé son intention d'investir plus de 60 milliards de dollars dans le développement de l'IA pour 2025, visant à maintenir sa compétitivité dans un paysage en évolution.
La technologie de DeepSeek, bien que considérée comme inférieure à celle d'OpenAI et de Google, gagne du terrain, ses modèles se classant dans le top 10 sur Chatbot Arena, une plateforme d'évaluation des performances.