谷歌发布Veo 3.1 AI视频模型:配备新一代Flow工具和更丰富的音频功能

编辑者: Veronika Radoslavskaya

谷歌最新一代人工智能视频生成模型Veo 3.1的发布,以及其配套的Flow电影制作套件的重大升级,正在深刻地改变数字内容创作领域。这次技术迭代标志着创作工具的实质性重新校准,为视觉叙事者提供了前所未有的高保真度和精细控制力,使其能够将复杂的概念转化为现实。本次发布的核心在于,AI框架内实现了更高水平的真实感、精密的同步音频功能,以及对叙事结构的更深层次、更直观的理解。

Veo 3.1是在2025年5月首次亮相的初代Veo 3模型基础上发展而来的。新版本通过卓越的纹理渲染和更细致入微的环境光照处理,将视觉输出质量推向了新的高度,使其更接近于摄影级的真实感。至关重要的是,该模型现在擅长先进的音频生成,确保音效和对话与视觉动作实现精密的同步,有效解决了早期生成系统中常见的沉浸感中断问题。此外,该AI对电影语言的理解更为深刻,能够更精确地遵循特定的风格提示。谷歌还同步推出了面向用户的Veo 3.1 Fast模型。

这种增强的生成能力直接通过升级后的Flow电影制作工具得以体现,该工具自推出以来已生成超过275 million个视频。现在,创作者可以利用一系列强大的新功能,旨在简化复杂的制作任务,实现事半功倍的效果。例如,“Ingredients to Video”(视频要素)功能允许用户输入多张参考图像,从而在整个序列中建立一致的角色设计和视觉美学,现在还加入了匹配的音频支持。对于宏大的叙事项目,“Scene Extension”(场景延伸)功能允许延长生成的片段,在保持音频连续性的同时,减轻了以往短片制作的限制。

Flow工具还引入了新颖的控制形式,进一步拓展了创作的可能性。“Frames to Video”(帧到视频)功能能够在用户定义的两张静态图像之间生成无缝的运动过渡,并配有同步的音频。此外,对象操作工具允许在场景内插入或移除元素,系统会智能地重新计算并应用逼真的阴影和光照效果。这些能力,包括对象插入和移除,旨在重新定义开发人员和企业用户通过Gemini API和Vertex AI平台访问该技术的工作流程,同时也惠及个体创作者。

这一技术飞跃凸显了谷歌致力于普及高保真、AI辅助视频制作的决心,将复杂的控制权直接交到富有远见的创作者手中。特别关注解决复杂的视觉连续性问题,例如在插入对象时保持一致的照明,表明谷歌深刻理解提升模拟效果至引人入胜艺术作品所需的微妙元素。行业分析指出,实现高时间一致性的模型在专业工作室中获得了最高的采用率,这使得Veo 3.1对对象持久性和场景延伸的强调,对于专业创意社区而言具有高度的相关性和价值。

来源

  • Beebom

  • 9to5Google

  • Google Developers Blog

  • TechCrunch

  • BGR

  • Google Cloud Blog

你发现了错误或不准确的地方吗?

我们会尽快考虑您的意见。