谷歌在美国山景城举行的年度 Google I/O 大会上推出了 Veo 3,这是一款能够从文本生成视频的先进人工智能模型。这个新版本可以解释用户编写的短篇故事,并将其转化为带有动画、面部表情和集成到叙事中的音频的片段。 Veo 3 包含与图像同步的音频,例如角色之间的对话、环境声音和音效。这代表着对其前身的重大进步,它能够理解复杂的描述并将其转化为具有详细物理特性、自然运动和环境声音的逼真场景。 Veo 3 与电影、音乐和视觉艺术专业人士合作开发,融合了 SynthID 技术,可以对人工智能生成的内容进行数字标记,以防止虚假信息。Veo 3 目前在美国通过 Gemini 应用程序向 Ultra 订阅者提供,并通过 Vertex AI 向企业提供。它也可以在 Google 的新人工智能辅助电影制作平台 Flow 上使用。
谷歌发布 Veo 3:人工智能模型生成带同步音频的视频
编辑者: Veronika Nazarova
来源
Visão
阅读更多关于该主题的新闻:
你发现了错误或不准确的地方吗?
我们会尽快考虑您的意见。