谷歌DeepMind发布Veo 3.1重大更新：新增专业级控制与原生竖屏视频生成功能

20:43, 13 一月

编辑者： Veronika Radoslavskaya

iframe { display: none; }

2026年1月13日，谷歌DeepMind正式宣布为其Veo 3.1视频生成模型推出一系列重量级功能更新。此次升级的焦点在于全新的“视频素材库”（Ingredients to Video）工具集，旨在为内容创作者提供前所未有的专业级精准度，助力其将静态参考图转化为极具张力的电影感动态画面。

iframe { display: none; }

为了顺应移动优先的内容消费趋势，Veo 3.1现已全面支持原生9:16竖屏输出。这一特性允许创作者直接为YouTube Shorts等短视频平台生成高质量的全屏内容，从而彻底解决了以往通过裁剪横向素材而导致的画质损失问题。

iframe { display: none; }

在追求极致视觉效果方面，谷歌引入了先进的4K超分辨率技术。该功能能够大幅提升画面的纹理细节与清晰度，确保AI生成的视频片段能够无缝嵌入专业影视制作工作流，并满足大屏幕显示的严苛要求。

iframe { display: none; }

此次更新在保持身份一致性与视觉风格连续性方面取得了显著突破。通过增强的“视频素材库”框架，创作者现在可以利用多维度的参考信息来精准引导AI的生成方向，极大地提升了创作的灵活性。

iframe { display: none; }

三图参考系统：用户可以同时上传多达三张参考图片，分别代表角色形象、环境背景和整体视觉风格。这种多重参考机制确保了AI在不同镜头切换中仍能保持角色特征的高度统一。
首末帧精准控制：这一强大的新功能赋予了创作者定义视频起始与结束画面的能力。Veo 3.1能够智能地在两个指定图像之间生成平滑且符合逻辑的电影级过渡，确保叙事的完整性。
场景智能延伸：为了便于构建更长的叙事篇幅，该模型现在支持基于前一段视频的最后几帧生成后续内容。这种延伸能力确保了视觉风格和动态节奏在长视频中的连贯衔接。

Veo 3.1在电影摄影语言的理解上也表现得更为出色，能够精准执行如“推近镜头”（dolly-in）、“横移”（pan）以及特定的“电影级光影”等专业指令。这些细节的优化使得生成的画面更具艺术感染力。

iframe { display: none; }

除了视觉层面的进化，该模型现在还能同步生成高质量的音频内容。这包括环境氛围音、各类音效（SFX）以及处于实验阶段的角色口型同步功能，为用户带来了视听合一的沉浸式创作体验。

目前，Veo 3.1的这些新特性已开始在谷歌生态系统中广泛部署。无论是通过Gemini应用、Flow专业电影制作平台，还是面向企业用户的Gemini API和Vertex AI，用户均可便捷地调用这些先进工具。

在安全性与透明度方面，所有由Veo 3.1生成的视频内容都将自动嵌入SynthID数字水印。这一不可见的标识有助于识别AI生成内容，维护数字内容的真实性与版权归属。

此外，谷歌还进一步强化了内容验证机制。用户只需将可疑视频上传至Gemini应用，即可快速检测该视频是否出自谷歌的AI工具之手，从而在AI创作时代构建起一道坚实的信任防线。

82 查看

来源

Digital Trends Español
Techmeme
Veo 3.1 Ingredients to Video: More consistency, creativity and control
Google Announces Veo 3.1 and New Flow Capabilities - Thurrott.com
Google DeepMind
The Best AI Video Generators in 2026: Tested, Reviewed & Ranked - by Jim Clyde Monge