Google Docs 推出 Gemini 驅動音訊摘要功能:為付費訂閱者打造的高效文件聆聽體驗

编辑者: Veronika Radoslavskaya

Google 於 2026 年 2 月 12 日正式啟動了 Google Docs 的一項重大人工智慧功能更新,標誌著文件處理進入了全新的語音合成時代。這項創新功能核心搭載了強大的 Gemini AI 模型,專為網頁版平台設計,能夠將繁雜的文件內容轉化為精煉的音訊概覽。此舉是繼 2025 年 8 月推出初步的 Gemini 循序朗讀功能後的又一里程碑;當時的功能僅能依序播放文字,而現在則實現了從單純「閱讀」到深度「理解」的技術跨越。

新推出的「音訊摘要」功能不僅僅是將文字轉為語音,而是透過 Gemini 的分析能力提取關鍵資訊。這些音訊簡報的時間長度通常控制在三分鐘以內,並採用了極其自然的人聲語音,旨在優化使用者的沉浸式體驗。Gemini AI 會自動剖析文件脈絡,識別出核心主題與論點,並將其重新組織成一段精簡的概述。這對於身處快節奏環境的知識工作者來說,無論是在通勤途中還是處理多項任務時,都能迅速掌握長篇研究報告或繁瑣會議記錄的精髓。

在使用者介面的整合上,這項功能被巧妙地安置於網頁版的「工具」選單中,標示為「聆聽文件摘要」選項,與原有的「聆聽此分頁」功能並列。為了提供更具個人化的體驗,系統提供了多種語音風格供選擇,包括「旁白」、「說服者」以及「教練」模式,且播放速度可在 0.5 倍至 2 倍之間自由調整。更為強大的是,該功能在生成摘要時能同時參考多個開啟的 Google Docs 分頁,確保產出的內容具備高度的相關性與脈絡連貫性。

關於存取權限,Gemini 驅動的音訊摘要目前專屬於付費訂閱體系。具體適用的方案包括 Workspace Business Standard 與 Plus、Enterprise Standard 與 Plus,以及針對企業與教育市場的加值方案如 Google AI Ultra for Business、Google AI Pro for Education。此外,個人用戶若訂閱 Google AI Pro 或 Ultra 方案亦可使用。該功能自 2026 年 2 月 12 日起開始逐步推送,預計在 15 天內完成全球符合條件網域的全面部署。

Google 官方特別指出,為了簡化部署流程,目前並未針對此功能設置獨立的管理員控制權限或複雜的終端使用者設定,旨在讓訂閱用戶能無縫接軌地享受 AI 帶來的便利。隨著這項技術的普及,Google Docs 將不再僅僅是文字編輯工具,更成為了高效的資訊處理與吸收平台,協助使用者在資訊爆炸的時代中更精準地獲取核心價值。

3 浏览量

來源

  • The News International

  • Business Standard

  • Google Workspace Updates

  • 9to5Google

  • Android Authority

  • NewsBytes

发现错误或不准确的地方吗?我们会尽快处理您的评论。