Google 在美國山景城舉行的年度 Google I/O 大會上發表了 Veo 3,這是一款能夠從文字生成影片的先進人工智慧模型。這個新版本可以解釋使用者編寫的短篇故事,並將其轉化為帶有動畫、面部表情和整合到敘事中的音訊的片段。 Veo 3 包含與圖像同步的音訊,例如角色之間的對話、環境聲音和音效。這代表著對其前身的重大進步,它能夠理解複雜的描述並將其轉化為具有詳細物理特性、自然運動和環境聲音的逼真場景。 Veo 3 與電影、音樂和視覺藝術專業人士合作開發,融合了 SynthID 技術,可以對人工智慧生成的內容進行數位標記,以防止虛假資訊。Veo 3 目前在美國透過 Gemini 應用程式向 Ultra 訂閱者提供,並透過 Vertex AI 向企業提供。它也可以在 Google 的新人工智慧輔助電影製作平台 Flow 上使用。
Google 發表 Veo 3:人工智慧模型生成帶同步音訊的影片
编辑者: Veronika Nazarova
來源
Visão
閱讀更多有關此主題的新聞:
发现错误或不准确的地方吗?
我们会尽快处理您的评论。