谷歌文档推出 Gemini 驱动的音频摘要功能,为订阅用户打造高效办公体验
编辑者: Veronika Radoslavskaya
自 2026 年 2 月 12 日起,科技巨头谷歌(Google)正式开始在 Google Docs 网页版中推行一项全新的人工智能功能。这一创新举措核心在于利用强大的 Gemini AI 模型,为用户生成文档内容的精炼音频概述。值得注意的是,该功能是在 2025 年 8 月推出的 Gemini 文档顺序朗读功能基础上的重大升级。相比于此前单纯的文本转语音,此次更新标志着从“机械阅读”向“智能理解”的跨越式进步。
这项全新的“音频摘要”功能能够精准提取文档中的关键信息,并将其转化为通常不超过三分钟的简短简报。为了提升用户体验,谷歌采用了极具自然感的语音技术,使听感更加亲切。Gemini AI 的核心优势在于其强大的内容合成能力:它不仅能分析文档,还能识别核心主题并生成浓缩的综述。对于需要处理冗长报告或会议记录的知识工作者而言,这无疑是一大福音,让他们在通勤或多任务处理时,也能迅速掌握文档精髓。
在操作界面上,该功能被无缝集成到了网页版 Google Docs 的“工具”(Tools)菜单中。用户可以在“收听此标签页”选项旁,轻松找到新增的“收听文档摘要”功能。为了满足个性化需求,系统提供了包括“叙述者”(narrator)、“说服者”(persuader)和“教练”(coach)在内的多种语音风格,且播放速度支持在 0.5 倍到 2 倍之间自由调节。此外,摘要生成过程还会综合考虑多个 Google Docs 标签页的内容,以确保信息的全面性与关联性。
目前,Gemini 驱动的音频摘要功能仅面向付费订阅用户开放。具体涵盖的方案包括:Workspace 商务标准版与增强版、企业标准版与增强版,以及针对企业的 Google AI Ultra 插件、针对教育领域的 Google AI Pro,以及个人版的 Google AI Pro 和 Ultra 计划。虽然该功能已于 2026 年 2 月 12 日启动推送,但全面覆盖所有符合条件的域名可能需要超过 15 天的时间。谷歌官方还特别说明,该功能目前不设独立的管理员控制项或终端用户设置。
随着人工智能技术的不断演进,谷歌正通过 Gemini 模型持续重塑办公协作的边界。此次音频摘要功能的上线,不仅展示了 AI 在自然语言处理和语音合成方面的深厚积淀,也反映了现代办公场景对信息获取效率的极致追求。通过将复杂的文字信息转化为易于吸收的音频简报,谷歌正助力全球职场人士在信息爆炸的时代,以更灵活、更高效的方式应对日常挑战。
3 查看
来源
The News International
Business Standard
Google Workspace Updates
9to5Google
Android Authority
NewsBytes
阅读更多关于该主题的新闻:
你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。
