En août 2025, le paysage de l'intelligence artificielle a été marqué par des annonces significatives de la part de deux acteurs chinois majeurs: ByteDance et DeepSeek. ByteDance, la société mère de TikTok, a lancé trois nouvelles variantes de son modèle d'IA open source, Seed-OSS-36B. Ces modèles se distinguent par leur capacité à traiter de longues fenêtres contextuelles et sont conçus pour faciliter l'utilisation par les développeurs. Simultanément, la startup chinoise DeepSeek a présenté la mise à niveau de son modèle DeepSeek-V3.1, intégrant une structure d'inférence hybride, des performances de traitement améliorées et des capacités d'agent accrues, reflétant l'accélération des progrès de la Chine dans le domaine de l'IA.
Le modèle Seed-OSS-36B de ByteDance a montré des performances compétitives, égalant ou surpassant des modèles similaires de grandes entreprises technologiques mondiales lors de tests de référence. Cette performance souligne la puissance croissante des modèles d'IA chinois. Parallèlement, le modèle V3.1 de DeepSeek a été optimisé pour les puces fabriquées en Chine, une avancée notable pour l'industrie nationale des semi-conducteurs. Ces annonces ont eu un impact immédiat sur le marché, provoquant une forte hausse des actions des entreprises de semi-conducteurs chinoises.
Les avancées en matière de longues fenêtres contextuelles, telles que celles proposées par ByteDance et DeepSeek, permettent aux modèles d'IA de traiter et de conserver une quantité de données considérablement plus importante. Les modèles comme le Seed-OSS-36B de ByteDance et le DeepSeek-V3.1 de DeepSeek, avec leurs fenêtres contextuelles étendues (jusqu'à 128 000 tokens pour DeepSeek-V3.1), sont capables d'analyser des documents volumineux, des bases de code complexes ou de maintenir la cohérence lors de longues conversations. Ces capacités sont essentielles pour des applications avancées telles que l'assistance à la recherche, le développement logiciel et l'IA conversationnelle.
ByteDance a adopté une stratégie open source avec Seed-OSS-36B, le rendant disponible sur des plateformes comme Hugging Face, dans le but de favoriser la collaboration mondiale et d'accélérer son adoption. Cette approche ouverte contraste avec les écosystèmes plus fermés de certaines entreprises occidentales, permettant ainsi la création de communautés de développeurs dynamiques. DeepSeek, quant à lui, a également acquis une reconnaissance pour ses modèles performants et économiques, se positionnant comme un acteur clé dans la démocratisation de l'IA avancée.
L'optimisation du DeepSeek-V3.1 pour les puces nationales chinoises met en évidence les efforts du pays pour renforcer son autonomie technologique, particulièrement dans le contexte des restrictions d'exportation de semi-conducteurs imposées par les États-Unis. Ces développements positionnent la Chine comme un concurrent de plus en plus redoutable sur la scène mondiale de l'IA, stimulant l'innovation et la compétitivité au sein de son propre secteur technologique.