谷歌发布Gemini 3 Deep Think重大升级 聚焦科学与工程难题攻克

编辑者: Veronika Radoslavskaya

谷歌于2026年2月12日正式推出其专业推理模式Gemini 3 Deep Think的重大迭代版本,此举标志着人工智能领域正从通用型模型向高度专业化、解决复杂技术问题的引擎战略性转移。此次升级是谷歌为应对科学、研究和工程领域中那些缺乏明确边界或数据不完备的严峻挑战而进行的深度优化,开发过程中与众多科学家和研究人员紧密合作,旨在将深厚的科学知识与实用的工程效能深度融合,从而推动人工智能从纯粹的理论探索迈向实际应用落地。

新版Deep Think在多个前沿人工智能基准测试中展现出突破性性能,巩固了其在严谨推理任务上的领先地位。具体而言,该模型在Codeforces基准测试中获得了3455 Elo评分,并在2025年国际数学奥林匹克竞赛(International Math Olympiad 2025)中达到了金牌级别的表现,彰显了其在算法和数学严谨性上的飞跃。此外,它在“人类的最后考试”(Humanity's Last Exam)中以不使用工具的情况下取得了48.4%的新世界先进水平成绩,并在ARC Prize Foundation验证的ARC-AGI-2基准测试中实现了84.6%的准确率。

此次发布的Deep Think着重于加速现实世界的工程应用,赋予研究人员解读复杂、混杂数据的能力,并允许工程师通过代码对物理系统进行建模,甚至能够将手绘草图转化为可供3D打印的成品文件。在学术验证方面,其能力得到了外部机构的认可,例如,罗格斯大学的数学家丽莎·卡本(Lisa Carbone)利用该模型成功发现了一篇高度技术性数学论文中先前被同行评审遗漏的细微逻辑缺陷,这标志着人工智能开始对研究过程实现实质性参与。

在尖端材料科学领域,杜克大学王实验室(Wang Lab)的研究人员,包括与该领域相关的郝哲“哈里”王(Haozhe “Harry” Wang),已将Deep Think应用于优化半导体晶体生长的制造方法。该模型成功设计出一种生长超过100微米薄膜的配方,达到了先前方法难以企及的精确目标,这对于推动电子技术超越传统硅基材料至关重要。

谷歌将此次升级定位为人工智能成熟度的重要里程碑,旨在将Deep Think定位为科学家的“增效器”,而非仅仅是信息检索工具。该模型在化学和物理等更广泛的科学领域也表现出色,在2025年国际物理奥林匹克竞赛和化学奥林匹克竞赛的书面部分取得了金牌级别的成绩,并在理论物理学的CMT-Benchmark中获得了50.5%的得分。

此次更新的Gemini 3 Deep Think现已对Google AI Ultra订阅用户在Gemini应用中开放,并且谷歌首次通过API向选定的外部研究人员、工程师和企业提供早期访问权限,预示着谷歌正积极将这种深度推理能力嵌入到工业级工作流程中。业界分析认为,谷歌此举标志着人工智能市场正从“一刀切”的模型转向“专业推理引擎”的架构转变。

17 查看

来源

  • Hipertextual

  • Techgear.gr

  • Google Blog

  • A new era of intelligence with Gemini 3 - Google Blog

  • Gemini 3 Deep Think gets 'major upgrade' aimed at practical applications - 9to5Google

  • Gemini 3 Deep Think: Advancing science, research and engineering - Google Blog

  • Get higher access to advanced AI in Google Workspace

  • Google upgrades Gemini 3 Deep Think across science, coding, research, and engineering | Seeking Alpha

  • 9to5Google

  • Google

  • 9to5Google

  • Wikipedia

你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。