Google DeepMind、テキストからインタラクティブな3Dワールドを生成するGenie 3を発表

10:44, 15 8月

編集者： Olga Sukhina

Google DeepMindは、テキストプロンプトからインタラクティブな3D環境をリアルタイムで生成できるAIモデル「Genie 3」を発表しました。この技術により、ユーザーは720pの解像度と毎秒24フレームで仮想世界を生成し、探索することが可能になります。Genie 3は、動的な3D空間を即座に構築し、その中を移動することを可能にし、環境の一貫性を長期間維持します。また、天候の変化やキャラクターの登場といった「プロンプタブルワールドイベント」をリアルタイムでサポートし、環境の変更を可能にします。

この技術は、ゲーム開発、教育、AIエージェントのトレーニングなど、多岐にわたる分野での応用が期待されています。Genie 3は、2024年に発表されたGenie 2の進化形であり、インタラクションの持続時間と一貫性が大幅に向上しています。Genie 2が最大20秒程度のインタラクションだったのに対し、Genie 3では数分間の連続したインタラクションが可能になりました。Google DeepMindは、Genie 3がAIエージェントのトレーニングにおいて重要な役割を果たすと考えており、特にロボット工学や自律システム開発への貢献を目指しています。現在、Genie 3は限定的なリサーチプレビューとして提供されており、安全面、バイアス、および責任ある利用について監視が行われています。

ソース元

Tom's Guide
Google DeepMind's Official Announcement on Genie 3
India Today's Coverage on Genie 3
The Times of India's Article on Genie 3
PC Gamer's Report on Genie 3
Google DeepMind's LinkedIn Post on Genie 3

このトピックに関するさらに多くのニュースを読む:

15 8月

ランボルギーニ、「フェノメノ」をモントレー・カー・ウィークで発表：史上最強・最速の量産車

15 8月

Apple、2026年にスマートホームカメラ市場へ参入へ：HomeKitとSiriとの統合で家庭の安全を強化

15 8月

Palabra AI、アレキス・オハニアン氏のSeven Seven Six主導で840万ドルのシード前資金調達を確保

エラーや不正確な情報を見つけましたか？

できるだけ早くコメントを考慮します。