阿里巴巴发布通义千问 Qwen 3.5:融合门控增量网络与稀疏专家模型,开启智能体 AI 新纪元
编辑者: Veronika Radoslavskaya
阿里巴巴集团近日正式发布了其新一代人工智能平台——通义千问 Qwen 3.5。据该公司介绍,这一版本的推出标志着其技术路线向“智能体 AI”(Agentic AI)的重大转型。与以往侧重于简单对话任务的模型不同,Qwen 3.5 旨在处理更为复杂且具备自主执行能力的操作系统,通过模拟人类的决策过程来完成跨平台的任务调度。
Qwen 3.5 的核心竞争力源于一种精密的新型架构。阿里巴巴表示,该架构将门控增量网络(Gated Delta Networks)与稀疏混合专家(MoE)框架进行了深度融合。这种设计巧妙地解决了超大规模模型在推理速度与计算成本之间的权衡难题,使得模型在保持强大理解能力的同时,能够实现极速响应。
- 在参数规模方面,阿里巴巴透露该模型拥有高达 3970 亿的总参数量。然而,得益于稀疏 MoE 结构的优化,它在每次前向传播过程中仅需激活 170 亿个参数。
- 这种选择性激活机制显著降低了计算负荷。根据开发团队的说法,这种优化不仅加速了 Token 的生成过程,还极大地改善了模型部署的经济效益,为大规模商业化应用扫清了障碍。
Qwen 3.5 被赋予了作为自主智能体运行的能力,能够独立规划并执行多步骤的工作流。阿里巴巴特别强调了该模型卓越的视觉智能体功能,使其能够像人类一样感知软件界面,在各种应用程序中做出独立决策并执行具体操作。这种能力意味着 AI 不再仅仅是建议者,而是能够直接操作工具的执行者。
针对深度文档分析和长篇逻辑推理的需求,阿里巴巴推出了闭源版本的 Qwen-3.5-Plus。该版本提供了惊人的 100 万 token 上下文窗口。这一容量能够支持模型在处理超长篇幅的法律文件、科研论文或复杂代码库时,依然保持高度的连贯性与逻辑严密性,有效解决了长文本处理中常见的上下文丢失问题。
为了推动全球化应用,阿里巴巴大幅扩展了模型的语言覆盖范围。Qwen 3.5 目前支持 201 种不同的语言和方言,较前代版本的 119 种有了显著提升。公司声称,这一进步强化了其在东南亚及欧洲等多元文化市场的表现。同时,阿里巴巴继续履行开源承诺,发布了 Qwen-3.5-Open,为全球科研社区提供了接触这些前沿架构改进的机会。
在性能表现上,Qwen 3.5 展现出了质的飞跃。阿里巴巴的数据显示,得益于架构层面的深度优化,该模型在处理大规模工作负载时的效率比 Qwen 3 系列提升了八倍。在自测基准测试中,该公司断言其模型在推理和编程任务上的表现已达到全球顶尖水平,甚至在多个维度上与 GPT-5.2 和 Claude Opus 4.6 等国际主流系统实现了性能对标。
3 查看
来源
The Peninsula
Reuters
IndexBox
South China Morning Post
Qatar news agency
Yeni Şafak
阅读更多关于该主题的新闻:
你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。
