阿里巴巴發表 Qwen 3.5:結合 Gated Delta 網路與稀疏 MoE 架構,開創代理式 AI 新紀元
编辑者: Veronika Radoslavskaya
阿里巴巴集團正式推出了其新一代人工智慧平台 Qwen 3.5,這標誌著該公司在技術戰略上的重大轉向。根據官方說明,Qwen 3.5 的核心開發目標在於實現「代理式人工智慧」(Agentic AI),這意味著該模型不僅能處理簡單的對話,更被賦予了執行複雜且具備高度自主性操作任務的能力,為 AI 應用開闢了全新路徑。
在技術底層架構上,Qwen 3.5 展現了極高的創新性。阿里巴巴指出,該模型成功融合了 Gated Delta 網路與稀疏混合專家(MoE)框架。這種設計旨在有效解決大型模型在擴張規模時,往往會面臨推理速度下降的權衡難題,確保系統在維持強大處理能力的同時,也能兼顧運算效率與反應速度。
- 參數規模與激活效率:阿里巴巴透露,儘管 Qwen 3.5 的總參數高達 3,970 億個,但得益於稀疏 MoE 結構,在每次前向傳播過程中僅需激活 170 億個參數。
- 運算負載優化:開發團隊強調,這種選擇性激活機制大幅降低了計算負擔,不僅優化了高速標記(token)生成的表現,也顯著提升了模型在實際部署時的經濟效益。
Qwen 3.5 的另一大亮點在於其強大的代理能力與長文本處理。該模型被設計為一個能夠自主規劃並執行多步驟工作流的智慧代理。阿里巴巴特別強調了其視覺代理功能,使模型能夠感知軟體介面,並在各種應用程式中做出獨立決策與執行動作,從而實現跨軟體的自動化操作。
針對長篇資訊的處理,阿里巴巴指出其閉源版本 Qwen-3.5-Plus 提供了驚人的 100 萬個標記(tokens)上下文視窗。這項能力讓模型在進行深度文件分析或長篇邏輯推理時,能夠在不丟失連貫性的前提下,精準掌握全文細節,滿足企業級複雜任務的需求。
為了加速全球化進程,阿里巴巴報告稱已顯著提升了模型的語言覆蓋範圍。Qwen 3.5 目前支援 201 種不同的語言與方言,較前一代版本的 119 種有了大幅跨越。該公司表示,這將強化其在東南亞及歐洲市場的競爭力。同時,阿里巴巴持續推動開放原始碼策略,發佈了 Qwen-3.5-Open,讓全球研究社群能共享這些先進的架構改進成果。
在性能表現方面,阿里巴巴聲稱 Qwen 3.5 的架構優化帶來了顯著的進步,處理大型工作負載的效能較 Qwen 3 系列提升了八倍。根據官方基準測試數據,該模型在邏輯推理與程式碼編寫任務上的表現,已能與 GPT-5.2 及 Claude Opus 4.6 等全球頂尖系統平起平坐,展現了強大的國際競爭力。
3 浏览量
來源
The Peninsula
Reuters
IndexBox
South China Morning Post
Qatar news agency
Yeni Şafak
閱讀更多有關此主題的新聞:
发现错误或不准确的地方吗?我们会尽快处理您的评论。
