Google DeepMind открывает ранний доступ к революционному прототипу Project Genie

Отредактировано: Veronika Radoslavskaya

29 января 2026 года подразделение Google DeepMind официально объявило о начале ограниченного раннего тестирования своего амбициозного исследовательского прототипа под названием Project Genie. На текущем этапе доступ к этой инновационной платформе открыт исключительно для подписчиков Gemini Ultra, находящихся в Соединенных Штатах. Данная разработка представляет собой уникальный инструмент, позволяющий пользователям создавать и исследовать интерактивные виртуальные миры, генерируемые в реальном времени на основе текстовых описаний или обычных фотографий. Это событие знаменует собой важную веху в развитии генеративного искусственного интеллекта, предлагая заглянуть в будущее цифровых развлечений.

В основе Project Genie лежит сложная гибридная архитектура, объединяющая три независимые системы искусственного интеллекта, которые работают в тесной связке. Этот технологический стек позволяет преобразовывать статические данные в живое, реагирующее пространство. Разработчики подчеркивают, что такая синергия моделей обеспечивает беспрецедентный уровень погружения, превращая воображение пользователя в визуальную реальность, где каждый элемент подчиняется внутренней логике системы.

  • Genie 3 (World Model): Фундаментальная модель от DeepMind, которая предсказывает каждый последующий кадр видеоряда на основе действий пользователя. Она имитирует целостную среду, используя принципы упрощенной физики для поддержания стабильности мира.
  • Nano Banana Pro: Специализированная версия имиджевой модели на базе Gemini, которая отвечает за создание первичного визуального фундамента. Она преобразует текстовую подсказку в высококачественное базовое изображение, с которого начинается вся симуляция.
  • Gemini (Orchestrator): Интеллектуальный агент, выступающий в роли логического движка. Он управляет перспективой камеры и действиями персонажей, гарантируя, что навигация по миру будет отзывчивой и интуитивно понятной для пользователя.

Принципиальное отличие Project Genie от классических игровых 3D-движков заключается в том, что он создает интерактивные видеостримы. Вместо рендеринга полигональных объектов система генерирует непрерывный поток кадров, который мгновенно реагирует на команды управления. Это порождает специфический, почти сновидческий опыт исследования цифрового пространства, где окружающая среда буквально достраивается на лету, создавая уникальную атмосферу взаимодействия, недоступную традиционным методам графического моделирования.

Поскольку технология находится на стадии экспериментального тестирования, в настоящее время действуют строгие технические ограничения. Из-за высокой вычислительной сложности процессов генерации в реальном времени длительность одной интерактивной сессии ограничена 60 секундами. Визуальный контент транслируется в разрешении 720p с частотой 24 кадра в секунду (FPS), что является необходимым компромиссом для обеспечения стабильной работы системы в текущих условиях.

Особое внимание разработчики уделили творческой свободе пользователей, внедрив функцию «ремикса». Этот инструмент позволяет брать за основу уже созданные генерации и трансформировать их, изменяя художественную стилистику или даже фундаментальные правила, по которым функционирует виртуальный мир. Такая возможность превращает процесс исследования в итеративное творчество, где каждая новая версия мира может кардинально отличаться от предыдущей, предоставляя бесконечные варианты для визуальных экспериментов.

Шломи Фрухтер, директор по исследованиям в DeepMind, отметил, что данный прототип призван продемонстрировать возможности, которые невозможно реализовать с помощью стандартных методов рендеринга. Основная цель публичного теста — сбор данных для обучения моделей мира пониманию физики и пространственной логики. В долгосрочной перспективе эти наработки станут фундаментом для создания безопасных агентов «воплощенного ИИ», способных эффективно функционировать в робототехнике и сложнейших симуляциях реальности, понимая последствия своих действий в физическом пространстве.

15 Просмотров

Источники

  • Cadena 3 Argentina

  • The Tech Buzz

  • The Tech Buzz

  • Android Authority

  • The Tech Buzz

  • Google DeepMind: The Podcast

Вы нашли ошибку или неточность?Мы учтем ваши комментарии как можно скорее.