微软推出“超级增强”模式,Copilot集成GPT-5.2,赋能专业级任务

编辑者: Veronika Radoslavskaya

时间来到2025年12月,微软为其人工智能助手生态系统投下了一枚重磅炸弹,正式宣布推出名为“超级增强”(Smart Plus)的全新模式。此项重大的功能迭代,旨在将OpenAI最新的GPT-5.2系列模型深度整合进Microsoft 365 Copilot以及Copilot Studio之中,其核心目标是攻克那些对高级推理能力和多步骤逻辑要求极高的专业级工作场景。

“超级增强”模式的基石是其内置的GPT-5.2 Thinking模型。这款模型被精心设计,能够通过审慎的、循序渐进的推理过程来解决复杂问题。它充当了Copilot的“思考引擎”,在处理高风险的商业任务时,将准确性和结构质量置于首位,力求做到万无一失。

超级增强:为工作场景注入高级推理能力

GPT-5.2 Thinking在多个关键性能指标上展现出惊人的飞跃。首先,在GDPval基准测试中——这是一项衡量知识工作在44个职业领域表现的严苛评估——GPT-5.2 Thinking取得了高达70.9%的胜/平率,这一成绩远超前代GPT-5模型38.8%的基准线,标志着在专家级生产力方面迈出了坚实的一步。

  • 专家级生产力:在GDPval基准测试中,GPT-5.2 Thinking实现了70.9%的胜/平率,相较于GPT-5的38.8%基线有了质的飞跃。
  • 代码性能卓越:在软件工程领域,该模型树立了新的标杆,其在SWE-bench Pro测试中获得55.6%的成绩,在SWE-bench Verified测试中更是高达80.0%。这表明它已成为一个在实际调试和代码重构方面更为可靠的工具。
  • 长文本推理能力:GPT-5.2 Thinking在长文本检索测试中表现强劲,它能成功地在远超常规上下文窗口限制的文件中定位并整合信息。这包括在四针(4-needle)评估以及测试复杂、长期项目准确性的MRCRv2基准测试中取得领先地位。
  • 办公文档生成:该模式在创建复杂的“办公产物”方面表现出色,例如在Excel中构建高级财务模型,以及生成结构化、数据驱动的PowerPoint演示文稿。

与Work IQ及GitHub Copilot的深度融合

这一全新的模型系列已经深度嵌入到微软的核心生产力和开发者工具链中,实现了无缝协作。

  • Work IQ集成:在Microsoft 365环境中,GPT-5.2通过Work IQ获得“知识基础”,使其能够跨越用户的工作上下文——包括电子邮件、会议记录和SharePoint数据——进行推理,从而提供具有实际操作价值的商业洞察。
  • GitHub Copilot升级:作为微软向其编码助手全面推广GPT-5.x模型系列的一部分,GPT-5.2已开始在GitHub Copilot中显现,显著增强了开发人员所使用的“Agent”和“Edit”模式的功能。
  • Copilot Studio赋能:开发者现在可以在Copilot Studio中明确选择GPT-5.2 Thinking模型,用于构建定制化的智能体,从而享受到更精准的指令遵循能力和更可靠的工具调用机制。

GPT-5.2和“超级增强”模式的推出遵循一个精心规划的分阶段部署时间表,确保平稳过渡。

  • 当前可用性:对于已拥有Microsoft 365 Copilot许可的用户,以及Copilot Enterprise和Business的订阅者来说,GPT-5.2目前已可投入使用。
  • Microsoft 365 Premium用户:预计Microsoft 365 Premium的订阅者将在2026年初获得访问新模型系列的权限。
  • 全球平台同步:此次更新正在Copilot的网页界面、Windows系统以及移动应用程序上同步推送。
  • 免费层级考量:尽管GPT-5.2系列将支撑Copilot的通用体验,但对于非付费用户而言,访问高资源消耗的“Thinking”模式预计将受到每日使用次数的限制。

25 查看

来源

  • STARTUPPER

  • OpenAI Launches GPT-5.2 'Garlic' with 400K Context Window for Enterprise Coding

  • Available today: GPT-5.2 in Microsoft 365 Copilot

  • Microsoft Copilot Upgrades to GPT-5.2, Free Access to a New Era of Expert-Level Workflows

  • Introducing GPT-5.2 - OpenAI's New Best AI Model | AI Hub

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。