Google DeepMind、テキストからインタラクティブな3Dワールドを生成するGenie 3を発表
編集者: Olga Sukhina
Google DeepMindは、テキストプロンプトからインタラクティブな3D環境をリアルタイムで生成できるAIモデル「Genie 3」を発表しました。この技術により、ユーザーは720pの解像度と毎秒24フレームで仮想世界を生成し、探索することが可能になります。Genie 3は、動的な3D空間を即座に構築し、その中を移動することを可能にし、環境の一貫性を長期間維持します。また、天候の変化やキャラクターの登場といった「プロンプタブルワールドイベント」をリアルタイムでサポートし、環境の変更を可能にします。
この技術は、ゲーム開発、教育、AIエージェントのトレーニングなど、多岐にわたる分野での応用が期待されています。Genie 3は、2024年に発表されたGenie 2の進化形であり、インタラクションの持続時間と一貫性が大幅に向上しています。Genie 2が最大20秒程度のインタラクションだったのに対し、Genie 3では数分間の連続したインタラクションが可能になりました。Google DeepMindは、Genie 3がAIエージェントのトレーニングにおいて重要な役割を果たすと考えており、特にロボット工学や自律システム開発への貢献を目指しています。現在、Genie 3は限定的なリサーチプレビューとして提供されており、安全面、バイアス、および責任ある利用について監視が行われています。
ソース元
Tom's Guide
Google DeepMind's Official Announcement on Genie 3
India Today's Coverage on Genie 3
The Times of India's Article on Genie 3
PC Gamer's Report on Genie 3
Google DeepMind's LinkedIn Post on Genie 3
このトピックに関するさらに多くのニュースを読む:
エラーや不正確な情報を見つけましたか?
できるだけ早くコメントを考慮します。
