Google 正式發佈 Gemini 3.1 Pro：強化抽象推理、代理工作流與深度生態系整合

18:57, 19 二月

作者： Veronika Radoslavskaya

Google 正式發佈 Gemini 3.1 Pro：強化抽象推理、代理工作流與深度生態系整合-1

Google 於 2026 年 2 月 19 日正式揭曉了 Gemini 3.1 Pro 的最新進展。這款針對網頁端與高階企業應用設計的核心模型，目前已在 Google 的付費方案中上線。此次更新標誌著人工智慧在抽象推理、即時輔助以及與 Google 龐大多模態生態系統的無縫整合方面，邁出了極具意義的一大步。

Demis Hassabis

@demishassabis

·Follow

Excited to launch Gemini 3.1 Pro! Major improvements across the board including in core reasoning and problem solving. For example scoring 77.1% on the ARC-AGI-2 benchmark - more than 2x the performance of 3 Pro. Rolling out today in @GeminiApp, @antigravity and more - enjoy!

4:21 PM · Feb 19, 2026

4.9K

Read 246 replies

Watch on X

Gemini 3.1 Pro 在處理複雜且抽象的問題解決能力上展現了突破性的成就。在備受矚目的 ARC-AGI-2 基準測試中，該模型取得了 77.1% 的優異成績。相較於其前身 Gemini 3 Pro 在幾個月前僅獲得的 31.1%，這項數據不僅實現了翻倍增長，更正式超越了普通人類在該邏輯測試中的基準表現。

Google Gemini

@GeminiApp

·Follow

Replying to @GeminiApp

With this new release, Gemini applies advanced reasoning to make sense of complex, changing information in real-time. 3.1 Pro can utilize advanced reasoning to bridge the gap between complex APIs and user-friendly design. For example, Gemini built a live aerospace dashboard,

Watch on X

4:09 PM · Feb 19, 2026

1.1K

Read 19 replies

Watch on X

除了邏輯測試，該模型在程式碼執行與科學研究領域也表現卓越。根據 Google 內部的測試數據顯示，3.1 Pro 在自主執行程式碼與處理複雜科學推理方面的可靠性顯著提升。這使其不僅是一個對話工具，更成為具備高度能力的專業研究代理，能有效支援各類學術與技術開發任務。

雖然 Gemini 3.1 Pro 的核心強項在於高品質的文本生成、嚴謹分析與即時推理，但它在整個 Gemini 平台中扮演著「智慧調度員」的關鍵角色。透過其直覺的介面，使用者可以輕鬆啟動 Google 旗下多款頂尖的多模態創作模型，實現跨領域的協作應用：

影像生成 (Nano Banana)：專精於影像生成與編輯，具備高保真度的文字渲染能力，並支援多圖合成。
影片創作 (Veo)：能產出帶有原生音訊的高畫質影片，使用者可藉此延伸現有片段或透過參考圖導引生成。
音樂製作 (Lyria 3)：可創作長達 30 秒的專業級音樂，包含自動生成的歌詞與多語言擬真人聲，並全面採用 SynthID 水印技術以確保版權保護。

針對 Android 與 iOS 的付費訂閱用戶，本次更新大幅強化了 Gemini Live 的行動端互動體驗。這項功能讓 AI 從傳統的一問一答模式轉變為流暢的對話助手。使用者可以進行自然的語音交流，系統能優雅地處理對話中的中斷，使溝通更貼近真實的人際互動。

Gemini Live 的應用場景也得到了擴展。透過相機與螢幕共享功能，使用者可以分享手機鏡頭畫面，針對周遭環境進行即時詢問，或分享螢幕畫面以獲取特定應用程式的操作指引。此外，該模型還能深度解析上傳的文件、檔案以及 YouTube 影片內容，並展開具備脈絡的深入討論。

Gemini 3.1 Pro 專為處理更為繁重且具備自主性的企業級工作負載而設計。它是 Google 代理開發平台「Antigravity」的核心引擎，針對複雜的工具調用與程式碼執行流程進行了深度優化。這使得企業能夠構建更具效率的自動化工作流，提升整體生產力。

在處理效能上，該模型正式支援高達 100 萬個標記（tokens）的上下文視窗，且單次輸出上限擴展至 65,536 (64K) 個標記。這項驚人的容量讓使用者能在單一指令中處理海量數據。專為 Pro 與 Ultra 訂閱者提供的 NotebookLM 整合功能，更讓研究人員能跨越大量論文或程式碼庫，以更精簡的步驟生成結構嚴謹的長篇報告。