Google DeepMind анонсировал Genie 3, передовую модель искусственного интеллекта, способную генерировать интерактивные трехмерные (3D) среды на основе текстовых описаний. Эта технология позволяет пользователям исследовать и взаимодействовать с динамическими мирами, созданными ИИ, в реальном времени. Genie 3 обеспечивает согласованность окружения в течение нескольких минут, предлагая более продолжительный опыт без визуальных искажений, и поддерживает «события в мире по запросу», позволяя изменять погодные условия или добавлять новых персонажей во время взаимодействия.
Модель работает путем генерации каждого кадра «на лету», обеспечивая быструю реакцию и обратную связь. Genie 3 демонстрирует визуальную точность и отзывчивость, работая с разрешением 720p и частотой 24 кадра в секунду. Обученная на обширных видеоданных из интернета, модель извлекает правила движения и взаимодействия объектов, что позволяет создавать реалистичные и фантастические сценарии с высокой степенью детализации. Потенциальные области применения включают игровую индустрию, образование и обучение ИИ-агентов, а также подготовку к задачам в реальном мире, таким как робототехника и автономное вождение. Genie 3 является важным шагом в развитии «мировых моделей» — систем ИИ, способных моделировать аспекты мира и предсказывать развитие среды и последствия действий агентов. В настоящее время Genie 3 доступен в рамках ограниченного исследовательского предварительного просмотра для доверенных академических кругов и создателей контента.