Google DeepMind、テキストからインタラクティブな3Dワールドを生成するGenie 3を発表

編集者: Olga Sukhina

Google DeepMindは、テキストプロンプトからインタラクティブな3D環境をリアルタイムで生成できるAIモデル「Genie 3」を発表しました。この技術により、ユーザーは720pの解像度と毎秒24フレームで仮想世界を生成し、探索することが可能になります。Genie 3は、動的な3D空間を即座に構築し、その中を移動することを可能にし、環境の一貫性を長期間維持します。また、天候の変化やキャラクターの登場といった「プロンプタブルワールドイベント」をリアルタイムでサポートし、環境の変更を可能にします。

この技術は、ゲーム開発、教育、AIエージェントのトレーニングなど、多岐にわたる分野での応用が期待されています。Genie 3は、2024年に発表されたGenie 2の進化形であり、インタラクションの持続時間と一貫性が大幅に向上しています。Genie 2が最大20秒程度のインタラクションだったのに対し、Genie 3では数分間の連続したインタラクションが可能になりました。Google DeepMindは、Genie 3がAIエージェントのトレーニングにおいて重要な役割を果たすと考えており、特にロボット工学や自律システム開発への貢献を目指しています。現在、Genie 3は限定的なリサーチプレビューとして提供されており、安全面、バイアス、および責任ある利用について監視が行われています。

ソース元

  • Tom's Guide

  • Google DeepMind's Official Announcement on Genie 3

  • India Today's Coverage on Genie 3

  • The Times of India's Article on Genie 3

  • PC Gamer's Report on Genie 3

  • Google DeepMind's LinkedIn Post on Genie 3

エラーや不正確な情報を見つけましたか?

できるだけ早くコメントを考慮します。