Google、Veo 3を発表:AIモデルが同期オーディオ付きの動画を生成

編集者: Veronika Nazarova

Googleは、米国マウンテンビューで開催された年次Google I/Oイベントで、テキストから動画を生成できる高度なAIモデルであるVeo 3を発表しました。この新しいバージョンは、ユーザーが書いた短い物語を解釈し、アニメーション、表情、およびナレーションに統合されたオーディオを含むクリップに変換します。 Veo 3には、キャラクター間の対話、環境音、効果音など、画像と同期されたオーディオが含まれています。これは、複雑な説明を理解し、詳細な物理学、自然な動き、および環境音を備えたリアルなシーンに変換する能力を備えた、以前のバージョンからの大幅な進歩を表しています。 映画、音楽、およびビジュアルアートの専門家との協力で開発されたVeo 3は、AIによって生成されたコンテンツをデジタルでマークし、誤った情報を防ぐためにSynthIDテクノロジーを組み込んでいます。Veo 3は現在、米国でUltraサブスクライバー向けのGeminiアプリケーション、およびVertex AIを介して企業向けに利用可能です。また、GoogleのAI支援映画制作のための新しいプラットフォームであるFlowでも使用できます。

ソース元

  • Visão

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。