Google DeepMind近日发布了其最新人工智能模型Genie 3,该模型能够根据文本指令即时生成高度逼真且可交互的三维(3D)虚拟世界。这项技术标志着AI在创造沉浸式数字体验方面迈出重要一步,为游戏开发、教育和AI代理训练等领域带来广阔前景。
Genie 3的核心优势在于其“世界模型”架构,通过学习海量视频数据来理解物理规律和环境互动。该模型能够以720p分辨率和每秒24帧的流畅度,在几分钟内保持环境的一致性和真实感,支持用户进行实时探索和互动。用户可以通过简单的文本提示,如“生成一场暴风雨”或“添加一群鹿穿过滑雪道”,来即时修改环境或引入新元素,以测试AI代理在动态场景下的反应能力。Genie 3的“世界记忆”功能确保了用户返回场景后,之前的互动痕迹依然可见,增强了体验的连贯性。该模型已成功用于测试Google的SIMA代理,使其能在模拟世界中完成目标。Google DeepMind在模拟环境研究方面拥有超过十年的经验,Genie 3是其在实时交互和真实感方面取得显著进展的最新成果。与大型语言模型不同,Genie 3专注于生成可交互的虚拟世界,是训练物理AI代理的理想平台。目前,Genie 3仍处于有限的研究预览阶段,仅对部分开发者和研究人员开放,Google DeepMind正密切关注其安全性、偏见和负责任的使用,以确保技术的安全部署。