微软发布三款自研AI模型，加速“AI自给自足”战略进程

19:09, 06 四月

编辑者： Aleksandr Lytviak

iframe { display: none; }

2026年4月2日，微软公司宣布了旨在实现“AI自给自足”战略的关键举措，即公开发布三款完全由内部开发的专有AI基础模型。此举标志着这家软件巨头正从单纯的模型分发商转变为核心模型开发者，直接挑战OpenAI和谷歌等前沿实验室的地位。这三款模型——MAI-Transcribe-1（语音转文本）、MAI-Voice-1（语音生成）和MAI-Image-2（图像生成）——即刻起通过微软的Microsoft Foundry平台和新设立的MAI Playground向开发者提供预览版服务。

此次发布是微软超级智能团队（Mustafa Suleyman领导，该团队于六个月前成立）为追求“AI自给自足”目标而打出的首轮攻势，涵盖了企业级AI中最具商业价值的三个多模态领域。具体而言，MAI-Transcribe-1在行业标准的FLEURS基准测试中，于25种主要语言上均展现出企业级的准确性，其批处理转录速度比现有的Microsoft Azure Fast服务快2.5倍，并且在GPU成本上比领先的替代方案低约50%，起始定价为每小时0.36美元。MAI-Voice-1作为高保真语音生成模型，能够在单张GPU上用不到一秒的时间生成长达60秒的富有表现力的音频，定价为每百万字符22美元，并支持仅需数秒音频即可创建定制声音。而作为第二代产品的MAI-Image-2，在Arena.ai图像模型家族排行榜上位列第三，生成速度比前代产品快一倍以上，文本输入定价为每百万Token 5美元，已开始在Bing和PowerPoint等微软自有产品中部署。

微软AI首席执行官Mustafa Suleyman此前曾指出，公司正加速自主前沿模型的开发，以减少对OpenAI的长期依赖，并计划投入巨资建设自有的AI芯片集群以支持这些模型的训练。此次发布的三款模型，特别是MAI-Transcribe-1，已开始在Copilot的语音模式和Microsoft Teams的对话转录功能中进行内部测试，显示出微软快速用自研模型替代现有或第三方模型的意图。MAI-Image-2已吸引了全球最大的广告传播公司WPP等早期企业客户，WPP的全球首席创意官Rob Reilly称赞其在生成符合真实世界标准的图像方面具有潜力。

与此同时，微软正面临围绕其消费者版Copilot服务使用条款的争议。该条款（最后一次更新于2025年10月）明确指出Copilot“仅供娱乐目的”，并警告用户“不要依赖Copilot获取重要建议，使用风险自负”。这一措辞与微软将Copilot定位为Microsoft 365等生产力工具的商业营销形成了鲜明对比，引发了用户和评论家的批评。对此，一位公司发言人回应称，该“娱乐目的”表述是“遗留条款”，不再反映Copilot的当前用途，并将在下一次更新中进行修改。竞争对手如OpenAI和xAI的条款中也包含免责声明，但微软的措辞因其明确性而受到特别关注。

微软CEO Satya Nadella此前曾暗示Microsoft 365 Copilot具备高准确性，而此次新模型的推出及其具有竞争力的定价策略，旨在降低微软自身的销货成本，并对亚马逊、谷歌等云服务提供商施加价格压力。通过在Microsoft Foundry上提供这些模型，微软不仅在技术上寻求独立，也在商业模式上通过成本控制和生态系统整合来巩固其在企业AI市场的主导地位，尽管其与OpenAI的合作关系（知识产权权利延续至2032年）仍在继续，但战略重心已转向垂直整合。

5 查看

来源

Business Insider
VentureBeat
AI Business
The Register
Business Insider
Mashable

通知中心

微软发布三款自研AI模型，加速“AI自给自足”战略进程

来源

阅读更多关于此主题的文章：