谷歌DeepMind发布Veo 3.1重大更新:新增专业级控制与原生竖屏视频生成功能

编辑者: Veronika Radoslavskaya

2026年1月13日,谷歌DeepMind正式宣布为其Veo 3.1视频生成模型推出一系列重量级功能更新。此次升级的焦点在于全新的“视频素材库”(Ingredients to Video)工具集,旨在为内容创作者提供前所未有的专业级精准度,助力其将静态参考图转化为极具张力的电影感动态画面。

为了顺应移动优先的内容消费趋势,Veo 3.1现已全面支持原生9:16竖屏输出。这一特性允许创作者直接为YouTube Shorts等短视频平台生成高质量的全屏内容,从而彻底解决了以往通过裁剪横向素材而导致的画质损失问题。

在追求极致视觉效果方面,谷歌引入了先进的4K超分辨率技术。该功能能够大幅提升画面的纹理细节与清晰度,确保AI生成的视频片段能够无缝嵌入专业影视制作工作流,并满足大屏幕显示的严苛要求。

此次更新在保持身份一致性与视觉风格连续性方面取得了显著突破。通过增强的“视频素材库”框架,创作者现在可以利用多维度的参考信息来精准引导AI的生成方向,极大地提升了创作的灵活性。

  • 三图参考系统:用户可以同时上传多达三张参考图片,分别代表角色形象、环境背景和整体视觉风格。这种多重参考机制确保了AI在不同镜头切换中仍能保持角色特征的高度统一。
  • 首末帧精准控制:这一强大的新功能赋予了创作者定义视频起始与结束画面的能力。Veo 3.1能够智能地在两个指定图像之间生成平滑且符合逻辑的电影级过渡,确保叙事的完整性。
  • 场景智能延伸:为了便于构建更长的叙事篇幅,该模型现在支持基于前一段视频的最后几帧生成后续内容。这种延伸能力确保了视觉风格和动态节奏在长视频中的连贯衔接。

Veo 3.1在电影摄影语言的理解上也表现得更为出色,能够精准执行如“推近镜头”(dolly-in)、“横移”(pan)以及特定的“电影级光影”等专业指令。这些细节的优化使得生成的画面更具艺术感染力。

除了视觉层面的进化,该模型现在还能同步生成高质量的音频内容。这包括环境氛围音、各类音效(SFX)以及处于实验阶段的角色口型同步功能,为用户带来了视听合一的沉浸式创作体验。

目前,Veo 3.1的这些新特性已开始在谷歌生态系统中广泛部署。无论是通过Gemini应用、Flow专业电影制作平台,还是面向企业用户的Gemini API和Vertex AI,用户均可便捷地调用这些先进工具。

在安全性与透明度方面,所有由Veo 3.1生成的视频内容都将自动嵌入SynthID数字水印。这一不可见的标识有助于识别AI生成内容,维护数字内容的真实性与版权归属。

此外,谷歌还进一步强化了内容验证机制。用户只需将可疑视频上传至Gemini应用,即可快速检测该视频是否出自谷歌的AI工具之手,从而在AI创作时代构建起一道坚实的信任防线。

50 查看

来源

  • Digital Trends Español

  • Techmeme

  • Veo 3.1 Ingredients to Video: More consistency, creativity and control

  • Google Announces Veo 3.1 and New Flow Capabilities - Thurrott.com

  • Google DeepMind

  • The Best AI Video Generators in 2026: Tested, Reviewed & Ranked - by Jim Clyde Monge

你发现了错误或不准确的地方吗?我们会尽快考虑您的意见。