Google DeepMind 升級 Veo 3.1:導入專業級控制功能與原生直式影片支援

编辑者: Veronika Radoslavskaya

2026 年 1 月 13 日,Google DeepMind 正式宣布為其領先的影片生成模型 Veo 3.1 推出重大功能更新。此次改版的核心在於「影片素材庫」(Ingredients to Video)工具組,旨在為創作者提供專業級的精準度,將參考圖像轉化為具備電影質感的動態影像。

為了迎合當前行動裝置優先的內容創作趨勢,Veo 3.1 現在正式支援原生 9:16 直式影片輸出。這項優化讓創作者能直接為 YouTube Shorts 等平台生成高品質的全螢幕內容,徹底解決了以往因橫向畫面裁剪而造成的解析度損失問題。

針對專業製作的高標準需求,Google 同步導入了先進的 4K 升頻技術。這項功能顯著強化了影像的紋理細節與精細度,使 AI 生成的片段不僅能無縫融入專業工作流,在大型顯示裝置上也能呈現極致的視覺品質。

此次更新的技術突破重點在於維持角色身分與視覺風格的一致性。透過強化後的「影片素材庫」架構,創作者現在可以更精確地引導 AI 進行創作,確保生成內容在視覺邏輯上保持高度連貫。

其中一項關鍵功能是「三圖參考」機制。使用者可以同時提供最多三張參考圖,例如特定的角色形象、環境背景以及視覺風格,藉此引導單次生成任務。這能確保 AI 在不同場景中精確維持角色的特徵,避免視覺上的偏差。

此外,新推出的「首末幀控制」功能賦予了創作者前所未有的掌控權。透過設定影片的確切起始點與終點圖像,Veo 3.1 能夠生成流暢且具備電影感的過渡畫面,在整個動態過程中保持嚴謹的視覺邏輯。

為了支援更長篇幅的敘事需求,該模型現在也具備場景延伸能力。它能根據前一段影片的最後幾幀內容自動生成後續片段,確保視覺風格與運動軌跡在長篇故事中保持高度的一致性與連貫性。

在攝影表現方面,Veo 3.1 展現了更高的電影智慧。它能精準解讀專業攝影指令,如「推軌鏡頭」(dolly-in)、「平移」(pan)或「電影級燈光」等。這讓 AI 生成的影片在鏡頭語言上更貼近真實的電影製作水平。

除了視覺上的進化,Veo 3.1 現在還能同步生成高品質音訊。這包括環境背景音、音效(SFX)以及實驗性的角色對嘴功能。這些元素的結合,為觀眾創造了更具沉浸感且視聽和諧的觀影體驗。

目前,這些先進的 Veo 3.1 功能正逐步整合至 Google 的各項服務中。創作者可以透過 Gemini 應用程式或 Flow 電影製作平台使用這些工具,體驗 AI 驅動的創作便利性。

對於企業級用戶,這些功能也已透過 Gemini API 以及 Vertex AI 平台開放。這使得專業工作室與開發者能夠將 Veo 3.1 的強大生成能力整合進自有的生產流程中。

為了維護數位內容的透明度與安全性,所有由 Veo 3.1 生成的影像均已嵌入 SynthID 數位浮水印。這項技術能在不影響視覺品質的前提下,為 AI 生成內容提供隱形的識別標記,確保來源可溯。

最後,Google 還為使用者提供了便捷的驗證管道。使用者只需將影片上傳至 Gemini 應用程式,即可查核該內容是否由 Google 的 AI 工具產製,這為辨識內容真實性提供了強而有力的技術支援。

50 浏览量

來源

  • Digital Trends Español

  • Techmeme

  • Veo 3.1 Ingredients to Video: More consistency, creativity and control

  • Google Announces Veo 3.1 and New Flow Capabilities - Thurrott.com

  • Google DeepMind

  • The Best AI Video Generators in 2026: Tested, Reviewed & Ranked - by Jim Clyde Monge

发现错误或不准确的地方吗?我们会尽快处理您的评论。