Google DeepMindは2025年8月5日、テキストプロンプトからインタラクティブな3D環境をリアルタイムで生成できる新しいAIモデル「Genie 3」を発表しました。このモデルは、人間とAIエージェントの両方が生成された世界内でリアルタイムに移動し、相互作用することを可能にします。Genie 3は、毎秒24フレーム、720pの解像度で数分間のインタラクティブな3D環境を生成し、前モデルのGenie 2を改良したものです。研究ディレクターのShlomi Fruchter氏は、Genie 3を「初のリアルタイムインタラクティブ汎用ワールドモデル」と評しました。
Genie 3は、AIエージェントが自身の経験から学習することを可能にし、ゲーム開発、教育、ロボット工学など多岐にわたる分野での応用が期待されています。例えば、教育分野では地理や生物学のシミュレーションツールとして、ロボット工学では物理的に現実的な環境でのエージェント訓練に役立つ可能性があります。このモデルは、過去のフレームを参照してオブジェクトの相互作用を学習し、フレームごとに一貫性を保つことで、ユーザーが生成された世界を探索し、リアルタイムで変更を加えることを可能にします。現在、Genie 3は限定的なリサーチプレビューとして提供されており、将来的にはより幅広いユーザーへのアクセス拡大が計画されています。Google DeepMindは、安全で責任あるAI開発を重視し、この新しい技術の展開においても潜在的なリスクの理解と軽減に努めています。