Alibaba dévoile Qwen 3.5 : Une architecture innovante de Gated Delta Networks et MoE pour l'IA agentique

Édité par : Veronika Radoslavskaya

Alibaba Group a officiellement levé le voile sur Qwen 3.5, sa plateforme d'intelligence artificielle de nouvelle génération. Selon les déclarations de l'entreprise, ce lancement marque un tournant technique majeur vers ce qu'elle appelle l'« IA agentique ». Ce pivot stratégique se concentre sur un modèle spécifiquement conçu pour réaliser des opérations autonomes complexes, dépassant ainsi les simples capacités de discussion textuelle pour devenir un véritable outil d'exécution capable de gérer des workflows sophistiqués.

Une architecture inédite : Gated Delta Networks et MoE

Au cœur de la structure de Qwen 3.5 se trouve une architecture sophistiquée qui, selon Alibaba, fusionne les Gated Delta Networks avec un cadre de mélange d'experts (MoE) clairsemé. Cette conception technique de pointe vise à résoudre le dilemme persistant entre la taille globale du modèle et la rapidité de l'inférence, permettant une utilisation plus fluide et réactive dans des environnements de production exigeants.

  • Paramètres actifs vs totaux : Alibaba précise que si le modèle dispose d'un nombre total impressionnant de 397 milliards de paramètres, sa structure MoE ne sollicite que 17 milliards de paramètres lors de chaque passage vers l'avant.
  • Efficacité accrue : Selon les développeurs, cette activation sélective réduit de manière significative la charge computationnelle. Cette efficacité optimise non seulement la vitesse de génération des jetons, mais améliore également la rentabilité économique du déploiement à grande échelle.

Capacités agentiques et fenêtre de contexte étendue

Qwen 3.5 a été élaboré pour agir en tant qu'agent autonome, capable de planifier méticuleusement et d'exécuter des flux de travail complexes comprenant plusieurs étapes successives sans intervention humaine constante.

  • Agents visuels : Alibaba met particulièrement l'accent sur les capacités agentiques visuelles du modèle. Ces dernières lui permettent d'interpréter les interfaces logicielles, de prendre des décisions de manière indépendante et d'exécuter des actions concrètes à travers diverses applications informatiques.
  • 1 million de jetons : La firme souligne que la version propriétaire, nommée Qwen-3.5-Plus, bénéficie d'une fenêtre de contexte atteignant 1 million de jetons. Une telle capacité permet une analyse extrêmement fine de documents très longs et soutient un raisonnement complexe sur de vastes ensembles de données sans aucune perte de cohérence.

Portée mondiale et engagement Open Source

Pour garantir une adoption globale, Alibaba rapporte avoir considérablement élargi le spectre linguistique de son outil. Qwen 3.5 supporte désormais 201 langues et dialectes différents, une progression notable par rapport aux 119 langues gérées par la version précédente. Cette stratégie vise explicitement à renforcer la performance du modèle sur les marchés stratégiques d'Asie du Sud-Est et d'Europe.

Dans la continuité de sa politique de transparence, Alibaba a également rendu publique la version Qwen-3.5-Open. En proposant ce modèle en accès libre avec ses poids ouverts, l'entreprise offre à la communauté internationale des chercheurs la possibilité d'explorer et d'intégrer ces avancées architecturales majeures dans leurs propres travaux.

Gains de performance et benchmarks comparatifs

Sur le plan des performances pures, les optimisations intégrées à Qwen 3.5 ont porté leurs fruits. Alibaba annonce une amélioration par huit de la gestion des charges de travail massives par rapport à la génération précédente, la série Qwen 3. Cette montée en puissance permet au modèle de traiter des requêtes simultanées plus lourdes avec une stabilité accrue et une latence réduite.

Enfin, selon les tests de référence communiqués par l'entreprise, Qwen 3.5 affiche des résultats comparables aux systèmes les plus performants du marché mondial. Alibaba revendique notamment une parité avec des modèles de renom tels que GPT-5.2 et Claude Opus 4.6, particulièrement dans les domaines du raisonnement logique et des tâches complexes de programmation informatique, positionnant ainsi le modèle comme un acteur incontournable de l'industrie.

3 Vues

Sources

  • The Peninsula

  • Reuters

  • IndexBox

  • South China Morning Post

  • Qatar news agency

  • Yeni Şafak

Avez-vous trouvé une erreur ou une inexactitude ?Nous étudierons vos commentaires dans les plus brefs délais.