Google 發表 Veo 3.1 AI 影片模型：整合新一代 Flow 工具集與更精細的音訊處理

19:37, 15 十月

编辑者： Veronika Radoslavskaya

數位內容創作領域正迎來一場重大轉型，這得益於 Google 最新發布的 Veo 3.1 人工智慧影片生成模型，以及對其整合式 Flow 影片製作套件進行的大幅強化。這次進化標誌著創意工具的實質性重新校準，為視覺敘事者提供了一種前所未有的方式，能夠以更高的還原度和更精準的控制力，實現複雜的概念。本次發布的核心要旨，在於透過 AI 框架，提供更優異的真實感、精密的同步音效功能，以及對敘事結構更深層次的直觀理解。

Veo 3.1 是在 2025 年 5 月首次亮相的 Veo 3 模型基礎上發展而來的。新版本透過卓越的紋理渲染和更細膩的環境光線處理，進一步提升了視覺輸出效果，使技術更接近照片級真實感。至關重要的是，該模型現在在進階音訊生成方面表現卓越，確保音效和對話能夠與視覺動作精確同步，解決了早期生成系統中常見的沉浸感中斷問題。此外，該 AI 對電影語言的理解也更為深刻，使其能夠更貼合特定的風格提示。同時，Google 也提供 Veo 3.1 Fast 模型供使用者選擇。

這種強化的生成能力，直接透過升級後的 Flow 影片製作工具得以實現。自推出以來，Flow 工具已生成超過 2 億 7500 萬部影片。現在，創作者可以運用一套強大的新功能，旨在簡化複雜的製作任務。「影片素材成分」（Ingredients to Video）功能允許使用者輸入多張參考圖像，從而在整個序列中建立一致的角色設計和視覺美學，現在甚至能搭配匹配的音訊。對於宏大的敘事，新增的「場景延伸」（Scene Extension）功能則允許延長生成的片段，在維持音訊連貫性的同時，減輕了先前短片格式的限制。

Flow 工具還引入了新穎的控制形式，例如「影格轉影片」（Frames to Video），它能在兩個使用者定義的靜態圖像之間生成無縫的動態畫面，並配有同步音訊。此外，物件操作工具支援在場景中插入或移除元素，系統會智慧地重新計算並應用逼真的陰影和照明效果。這些功能，包括物件的插入與移除，將重新定義開發人員和企業用戶的工作流程，他們可以透過 Gemini API 和 Vertex AI 平台存取這項技術，同時也惠及個別創作者。

這次技術飛躍突顯了 Google 致力於普及高擬真度、AI 輔助影片製作的決心，將複雜的控制權直接交到有遠見的創作者手中。特別關注解決複雜的視覺連續性問題，例如在插入物件時保持一致的光線，顯示出 Google 對於將模擬提升為引人入勝藝術的細微元素的深刻理解。業界分析指出，能夠實現高時間一致性（temporal consistency）的模型，正在專業工作室中獲得極高的採用率。因此，Veo 3.1 對於物件持久性和場景延伸的強調，對於專業創意社群來說，具有極高的實用價值和相關性。

來源

Beebom
9to5Google
Google Developers Blog
TechCrunch
BGR
Google Cloud Blog

閱讀更多有關此主題的新聞：

17 十月

Windows 11：微軟透過 Copilot 將個人電腦轉變為智慧型助理

15 十月

Anthropic 推出 Claude Haiku 4.5，引發 AI 定價崩盤，普及近頂尖性能

14 十月

微軟推出自家MAI-Image-1生成器，確立獨立AI發展路線

发现错误或不准确的地方吗？

我们会尽快处理您的评论。

通知中心

通知中心

Google 發表 Veo 3.1 AI 影片模型：整合新一代 Flow 工具集與更精細的音訊處理

來源

閱讀更多有關此主題的新聞：