Google 正式發佈 Gemini 3.1 Pro:強化抽象推理、代理工作流與深度生態系整合
作者: Veronika Radoslavskaya
Google 於 2026 年 2 月 19 日正式揭曉了 Gemini 3.1 Pro 的最新進展。這款針對網頁端與高階企業應用設計的核心模型,目前已在 Google 的付費方案中上線。此次更新標誌著人工智慧在抽象推理、即時輔助以及與 Google 龐大多模態生態系統的無縫整合方面,邁出了極具意義的一大步。
Gemini 3.1 Pro 在處理複雜且抽象的問題解決能力上展現了突破性的成就。在備受矚目的 ARC-AGI-2 基準測試中,該模型取得了 77.1% 的優異成績。相較於其前身 Gemini 3 Pro 在幾個月前僅獲得的 31.1%,這項數據不僅實現了翻倍增長,更正式超越了普通人類在該邏輯測試中的基準表現。
除了邏輯測試,該模型在程式碼執行與科學研究領域也表現卓越。根據 Google 內部的測試數據顯示,3.1 Pro 在自主執行程式碼與處理複雜科學推理方面的可靠性顯著提升。這使其不僅是一個對話工具,更成為具備高度能力的專業研究代理,能有效支援各類學術與技術開發任務。
雖然 Gemini 3.1 Pro 的核心強項在於高品質的文本生成、嚴謹分析與即時推理,但它在整個 Gemini 平台中扮演著「智慧調度員」的關鍵角色。透過其直覺的介面,使用者可以輕鬆啟動 Google 旗下多款頂尖的多模態創作模型,實現跨領域的協作應用:
- 影像生成 (Nano Banana):專精於影像生成與編輯,具備高保真度的文字渲染能力,並支援多圖合成。
- 影片創作 (Veo):能產出帶有原生音訊的高畫質影片,使用者可藉此延伸現有片段或透過參考圖導引生成。
- 音樂製作 (Lyria 3):可創作長達 30 秒的專業級音樂,包含自動生成的歌詞與多語言擬真人聲,並全面採用 SynthID 水印技術以確保版權保護。
針對 Android 與 iOS 的付費訂閱用戶,本次更新大幅強化了 Gemini Live 的行動端互動體驗。這項功能讓 AI 從傳統的一問一答模式轉變為流暢的對話助手。使用者可以進行自然的語音交流,系統能優雅地處理對話中的中斷,使溝通更貼近真實的人際互動。
Gemini Live 的應用場景也得到了擴展。透過相機與螢幕共享功能,使用者可以分享手機鏡頭畫面,針對周遭環境進行即時詢問,或分享螢幕畫面以獲取特定應用程式的操作指引。此外,該模型還能深度解析上傳的文件、檔案以及 YouTube 影片內容,並展開具備脈絡的深入討論。
Gemini 3.1 Pro 專為處理更為繁重且具備自主性的企業級工作負載而設計。它是 Google 代理開發平台「Antigravity」的核心引擎,針對複雜的工具調用與程式碼執行流程進行了深度優化。這使得企業能夠構建更具效率的自動化工作流,提升整體生產力。
在處理效能上,該模型正式支援高達 100 萬個標記(tokens)的上下文視窗,且單次輸出上限擴展至 65,536 (64K) 個標記。這項驚人的容量讓使用者能在單一指令中處理海量數據。專為 Pro 與 Ultra 訂閱者提供的 NotebookLM 整合功能,更讓研究人員能跨越大量論文或程式碼庫,以更精簡的步驟生成結構嚴謹的長篇報告。
27 浏览量
來源
Google Blog
閱讀更多有關此主題的新聞:
发现错误或不准确的地方吗?我们会尽快处理您的评论。
