Google DeepMind представляет Genie 3: ИИ создает интерактивные 3D-миры из текстовых запросов

Отредактировано: Olga Sukhina

Google DeepMind анонсировал Genie 3, передовую модель искусственного интеллекта, способную генерировать интерактивные трехмерные (3D) среды на основе текстовых описаний. Эта технология позволяет пользователям исследовать и взаимодействовать с динамическими мирами, созданными ИИ, в реальном времени. Genie 3 обеспечивает согласованность окружения в течение нескольких минут, предлагая более продолжительный опыт без визуальных искажений, и поддерживает «события в мире по запросу», позволяя изменять погодные условия или добавлять новых персонажей во время взаимодействия.

Модель работает путем генерации каждого кадра «на лету», обеспечивая быструю реакцию и обратную связь. Genie 3 демонстрирует визуальную точность и отзывчивость, работая с разрешением 720p и частотой 24 кадра в секунду. Обученная на обширных видеоданных из интернета, модель извлекает правила движения и взаимодействия объектов, что позволяет создавать реалистичные и фантастические сценарии с высокой степенью детализации. Потенциальные области применения включают игровую индустрию, образование и обучение ИИ-агентов, а также подготовку к задачам в реальном мире, таким как робототехника и автономное вождение. Genie 3 является важным шагом в развитии «мировых моделей» — систем ИИ, способных моделировать аспекты мира и предсказывать развитие среды и последствия действий агентов. В настоящее время Genie 3 доступен в рамках ограниченного исследовательского предварительного просмотра для доверенных академических кругов и создателей контента.

Источники

  • Tom's Guide

  • Google DeepMind's Official Announcement on Genie 3

  • India Today's Coverage on Genie 3

  • The Times of India's Article on Genie 3

  • PC Gamer's Report on Genie 3

  • Google DeepMind's LinkedIn Post on Genie 3

Вы нашли ошибку или неточность?

Мы учтем ваши комментарии как можно скорее.