谷歌发布 Gemini 3.1 Pro:深度推理、智能体工作流与全生态集成
作者: Veronika Radoslavskaya
2026年2月19日,谷歌正式披露了其最新核心模型 Gemini 3.1 Pro 的发布细节。该模型专为网页端及高级企业级应用量身打造,目前已在谷歌的付费订阅层级中全面上线。Gemini 3.1 Pro 在抽象推理能力、实时交互辅助以及与谷歌庞大的多模态 AI 生态系统的无缝集成方面,实现了跨越式的技术突破。
在复杂的抽象问题解决领域,Gemini 3.1 Pro 的表现尤为引人注目。在严苛的 ARC-AGI-2 基准测试中,该模型取得了 77.1% 的优异成绩。这一数据不仅是其前身 Gemini 3 Pro(数月前得分仅为 31.1%)的两倍有余,更标志着 AI 在此类逻辑密集型测试中正式超越了人类的平均基准水平。
除了逻辑测试的亮眼表现,Gemini 3.1 Pro 在编程与科学研究领域也展现了极高的可靠性。内部测试结果显示,与前几代模型相比,3.1 Pro 在自主代码执行和复杂科学推理方面的稳定性显著提升,使其能够胜任高强度的科研助理工作,为开发者和科学家提供强有力的技术支撑。
虽然 Gemini 3.1 Pro 的核心优势在于高质量文本生成、深度数据分析和实时逻辑推理,但它在整个 Gemini 平台中更扮演着“智能指挥官”的关键角色。通过其集成界面,用户可以轻松调度谷歌旗下的一系列顶尖多模态模型,完成多样化的创作任务:
- 图像创作 (Nano Banana): 利用先进的文本转图像及多图合成技术,能够生成并编辑带有高保真文本渲染的精美图像。
- 视频生成 (Veo): 创作带有原生音频的高保真视频,支持用户扩展现有视频剪辑,或通过参考图像引导生成特定风格的内容。
- 音乐合成 (Lyria 3): 生成专业级的 30 秒音乐片段,包含自动生成的歌词和多种语言的真实人声,所有作品均受 SynthID 水印技术保护以确保版权溯源。
针对 Android 和 iOS 平台的移动端付费用户,本次更新大幅强化了 Gemini Live 语音模式。这一功能的升级使 AI 从传统的问答式聊天机器人转变为一种更加自由、流畅的实时交互助手,极大地提升了移动办公与生活的便利性。
在 Gemini Live 模式下,用户可以进行自然且实时的语音对话,系统能够优雅地处理对话中的中断与插话。此外,该应用还支持分享实时摄像头画面以询问有关物理环境的问题,或通过屏幕共享功能获取当前活跃应用的步骤指导。该模型还能无缝解析并深入讨论用户上传的各类文件、文档以及 YouTube 视频内容。
为了应对更具挑战性的企业级自主任务,Gemini 3.1 Pro 针对智能体工作流进行了深度优化。它是谷歌智能体开发平台 Google Antigravity 的核心引擎,在处理复杂的工具调用和代码执行流程时表现卓越,能够自主完成多步骤的业务逻辑。
在性能参数方面,Gemini 3.1 Pro 官方支持高达 100 万 token 的超长上下文窗口,并将单次输出限制大幅扩展至 65,536 (64K) token。这种海量的数据处理能力配合 NotebookLM(专供 Pro 和 Ultra 订阅用户使用),使用户能够在单次提示中对庞大的研究论文集或复杂的代码库进行深度扫描,并快速生成结构化的长篇专业报告。
27 查看
来源
Google Blog
阅读更多关于该主题的新闻:
你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。
