Alibaba dévoile Qwen 3.5 : Une architecture innovante de Gated Delta Networks et MoE pour l'IA agentique
Édité par : Veronika Radoslavskaya
Alibaba Group a officiellement levé le voile sur Qwen 3.5, sa plateforme d'intelligence artificielle de nouvelle génération. Selon les déclarations de l'entreprise, ce lancement marque un tournant technique majeur vers ce qu'elle appelle l'« IA agentique ». Ce pivot stratégique se concentre sur un modèle spécifiquement conçu pour réaliser des opérations autonomes complexes, dépassant ainsi les simples capacités de discussion textuelle pour devenir un véritable outil d'exécution capable de gérer des workflows sophistiqués.
Une architecture inédite : Gated Delta Networks et MoE
Au cœur de la structure de Qwen 3.5 se trouve une architecture sophistiquée qui, selon Alibaba, fusionne les Gated Delta Networks avec un cadre de mélange d'experts (MoE) clairsemé. Cette conception technique de pointe vise à résoudre le dilemme persistant entre la taille globale du modèle et la rapidité de l'inférence, permettant une utilisation plus fluide et réactive dans des environnements de production exigeants.
- Paramètres actifs vs totaux : Alibaba précise que si le modèle dispose d'un nombre total impressionnant de 397 milliards de paramètres, sa structure MoE ne sollicite que 17 milliards de paramètres lors de chaque passage vers l'avant.
- Efficacité accrue : Selon les développeurs, cette activation sélective réduit de manière significative la charge computationnelle. Cette efficacité optimise non seulement la vitesse de génération des jetons, mais améliore également la rentabilité économique du déploiement à grande échelle.
Capacités agentiques et fenêtre de contexte étendue
Qwen 3.5 a été élaboré pour agir en tant qu'agent autonome, capable de planifier méticuleusement et d'exécuter des flux de travail complexes comprenant plusieurs étapes successives sans intervention humaine constante.
- Agents visuels : Alibaba met particulièrement l'accent sur les capacités agentiques visuelles du modèle. Ces dernières lui permettent d'interpréter les interfaces logicielles, de prendre des décisions de manière indépendante et d'exécuter des actions concrètes à travers diverses applications informatiques.
- 1 million de jetons : La firme souligne que la version propriétaire, nommée Qwen-3.5-Plus, bénéficie d'une fenêtre de contexte atteignant 1 million de jetons. Une telle capacité permet une analyse extrêmement fine de documents très longs et soutient un raisonnement complexe sur de vastes ensembles de données sans aucune perte de cohérence.
Portée mondiale et engagement Open Source
Pour garantir une adoption globale, Alibaba rapporte avoir considérablement élargi le spectre linguistique de son outil. Qwen 3.5 supporte désormais 201 langues et dialectes différents, une progression notable par rapport aux 119 langues gérées par la version précédente. Cette stratégie vise explicitement à renforcer la performance du modèle sur les marchés stratégiques d'Asie du Sud-Est et d'Europe.
Dans la continuité de sa politique de transparence, Alibaba a également rendu publique la version Qwen-3.5-Open. En proposant ce modèle en accès libre avec ses poids ouverts, l'entreprise offre à la communauté internationale des chercheurs la possibilité d'explorer et d'intégrer ces avancées architecturales majeures dans leurs propres travaux.
Gains de performance et benchmarks comparatifs
Sur le plan des performances pures, les optimisations intégrées à Qwen 3.5 ont porté leurs fruits. Alibaba annonce une amélioration par huit de la gestion des charges de travail massives par rapport à la génération précédente, la série Qwen 3. Cette montée en puissance permet au modèle de traiter des requêtes simultanées plus lourdes avec une stabilité accrue et une latence réduite.
Enfin, selon les tests de référence communiqués par l'entreprise, Qwen 3.5 affiche des résultats comparables aux systèmes les plus performants du marché mondial. Alibaba revendique notamment une parité avec des modèles de renom tels que GPT-5.2 et Claude Opus 4.6, particulièrement dans les domaines du raisonnement logique et des tâches complexes de programmation informatique, positionnant ainsi le modèle comme un acteur incontournable de l'industrie.
3 Vues
Sources
The Peninsula
Reuters
IndexBox
South China Morning Post
Qatar news agency
Yeni Şafak
Lisez plus d’actualités sur ce sujet :
Avez-vous trouvé une erreur ou une inexactitude ?Nous étudierons vos commentaires dans les plus brefs délais.
