谷歌发布 Veo 3：人工智能模型生成带同步音频的视频

13:16, 21 五月

编辑者： Veronika Radoslavskaya

谷歌在美国山景城举行的年度 Google I/O 大会上推出了 Veo 3，这是一款能够从文本生成视频的先进人工智能模型。这个新版本可以解释用户编写的短篇故事，并将其转化为带有动画、面部表情和集成到叙事中的音频的片段。 Veo 3 包含与图像同步的音频，例如角色之间的对话、环境声音和音效。这代表着对其前身的重大进步，它能够理解复杂的描述并将其转化为具有详细物理特性、自然运动和环境声音的逼真场景。 Veo 3 与电影、音乐和视觉艺术专业人士合作开发，融合了 SynthID 技术，可以对人工智能生成的内容进行数字标记，以防止虚假信息。Veo 3 目前在美国通过 Gemini 应用程序向 Ultra 订阅者提供，并通过 Vertex AI 向企业提供。它也可以在 Google 的新人工智能辅助电影制作平台 Flow 上使用。

来源

Visão

通知中心

谷歌发布 Veo 3：人工智能模型生成带同步音频的视频

来源

阅读更多关于该主题的新闻：