Google 發表 Veo 3.1 AI 影片模型:整合新一代 Flow 工具集與更精細的音訊處理

编辑者: Veronika Radoslavskaya

數位內容創作領域正迎來一場重大轉型,這得益於 Google 最新發布的 Veo 3.1 人工智慧影片生成模型,以及對其整合式 Flow 影片製作套件進行的大幅強化。這次進化標誌著創意工具的實質性重新校準,為視覺敘事者提供了一種前所未有的方式,能夠以更高的還原度和更精準的控制力,實現複雜的概念。本次發布的核心要旨,在於透過 AI 框架,提供更優異的真實感、精密的同步音效功能,以及對敘事結構更深層次的直觀理解。

Veo 3.1 是在 2025 年 5 月首次亮相的 Veo 3 模型基礎上發展而來的。新版本透過卓越的紋理渲染和更細膩的環境光線處理,進一步提升了視覺輸出效果,使技術更接近照片級真實感。至關重要的是,該模型現在在進階音訊生成方面表現卓越,確保音效和對話能夠與視覺動作精確同步,解決了早期生成系統中常見的沉浸感中斷問題。此外,該 AI 對電影語言的理解也更為深刻,使其能夠更貼合特定的風格提示。同時,Google 也提供 Veo 3.1 Fast 模型供使用者選擇。

這種強化的生成能力,直接透過升級後的 Flow 影片製作工具得以實現。自推出以來,Flow 工具已生成超過 2 億 7500 萬部影片。現在,創作者可以運用一套強大的新功能,旨在簡化複雜的製作任務。「影片素材成分」(Ingredients to Video)功能允許使用者輸入多張參考圖像,從而在整個序列中建立一致的角色設計和視覺美學,現在甚至能搭配匹配的音訊。對於宏大的敘事,新增的「場景延伸」(Scene Extension)功能則允許延長生成的片段,在維持音訊連貫性的同時,減輕了先前短片格式的限制。

Flow 工具還引入了新穎的控制形式,例如「影格轉影片」(Frames to Video),它能在兩個使用者定義的靜態圖像之間生成無縫的動態畫面,並配有同步音訊。此外,物件操作工具支援在場景中插入或移除元素,系統會智慧地重新計算並應用逼真的陰影和照明效果。這些功能,包括物件的插入與移除,將重新定義開發人員和企業用戶的工作流程,他們可以透過 Gemini API 和 Vertex AI 平台存取這項技術,同時也惠及個別創作者。

這次技術飛躍突顯了 Google 致力於普及高擬真度、AI 輔助影片製作的決心,將複雜的控制權直接交到有遠見的創作者手中。特別關注解決複雜的視覺連續性問題,例如在插入物件時保持一致的光線,顯示出 Google 對於將模擬提升為引人入勝藝術的細微元素的深刻理解。業界分析指出,能夠實現高時間一致性(temporal consistency)的模型,正在專業工作室中獲得極高的採用率。因此,Veo 3.1 對於物件持久性和場景延伸的強調,對於專業創意社群來說,具有極高的實用價值和相關性。

來源

  • Beebom

  • 9to5Google

  • Google Developers Blog

  • TechCrunch

  • BGR

  • Google Cloud Blog

发现错误或不准确的地方吗?

我们会尽快处理您的评论。