Google DeepMind відкриває обмежений ранній доступ до інноваційного прототипу «Project Genie»

Відредаговано: Veronika Radoslavskaya

29 січня 2026 року підрозділ Google DeepMind офіційно оголосив про початок етапу обмеженого раннього доступу до свого експериментального дослідницького прототипу під назвою Project Genie. На початковій стадії цей революційний інструмент доступний виключно для передплатників тарифного плану Gemini Ultra, які територіально перебувають у Сполучених Штатах. Новітня розробка дозволяє користувачам не просто спостерігати, а власноруч створювати та досліджувати динамічні цифрові середовища, що генеруються в реальному часі на основі простих текстових вказівок або завантажених еталонних зображень.

В основі функціонування Project Genie лежить надзвичайно складна гібридна архітектура штучного інтелекту, яка гармонійно поєднує три окремі спеціалізовані системи. Такий інтегрований підхід дозволяє перетворити статичні дані на живий, інтерактивний простір, де кожен елемент підпорядковується певній внутрішній логіці та реагує на дії користувача.

  • Genie 3 (World Model): Це фундаментальна модель світу від DeepMind, головним завданням якої є прогнозування кожного наступного кадру відеопослідовності на основі вхідних даних. Вона здатна симулювати цілісне середовище, спираючись на спрощені закони фізики, що забезпечує візуальну стабільність та логічність віртуального простору під час взаємодії.
  • Nano Banana Pro: Спеціалізована варіація моделі зображень на базі Gemini, яка відповідає за первинну візуалізацію. Цей компонент трансформує текстовий запит користувача у високоякісну графічну основу, яка слугує відправною точкою для всієї подальшої симуляції та визначає її естетичний вигляд.
  • Gemini (Orchestrator): Цей інтелектуальний агент виконує роль центрального механізму прийняття рішень. Він керує ракурсами віртуальної камери та діями персонажів, забезпечуючи миттєву та адекватну реакцію середовища на команди користувача, що робить процес навігації максимально реалістичним та чутливим.

На відміну від традиційних ігрових рушіїв, що базуються на 3D-рендерингу, Project Genie створює унікальні інтерактивні потоки відеоданих. Система в реальному часі генерує безперервну послідовність кадрів, які динамічно змінюються залежно від сигналів керування. Це дозволяє користувачам зануритися у своєрідне «цифрове сновидіння», де межі між статичним зображенням та інтерактивним світом стають майже непомітними.

Оскільки технологія наразі перебуває на стадії експериментального тестування, розробники впровадили низку суворих технічних обмежень. Через надзвичайно високу обчислювальну інтенсивність процесів генерації в реальному часі, тривалість кожної інтерактивної сесії чітко обмежена 60 секундами. Це дозволяє підтримувати стабільність системи та забезпечувати доступ до ресурсів для більшої кількості тестувальників.

Щодо технічних характеристик відтворення, то на поточному етапі середовища транслюються з роздільною здатністю 720p при частоті 24 кадри на секунду (FPS). Крім того, розробники додали цікаву функцію «реміксування», яка надає користувачам можливість модифікувати вже створені світи, змінюючи їхній візуальний стиль або навіть фундаментальні правила функціонування навколишнього середовища.

Шломі Фрухтер, директор з досліджень у DeepMind, підкреслив, що головна мета цього прототипу — продемонструвати інтерактивні можливості, які неможливо реалізувати за допомогою стандартних методів візуалізації. Публічне тестування є критично важливим для збору великого масиву даних, які допоможуть навчити моделі світу краще розуміти фізичні закони та складну просторову логіку.

У перспективі ці напрацювання стануть фундаментом для створення безпечних агентів «втіленого ШІ». Удосконалення здатності штучного інтелекту розуміти фізичний світ є ключовим кроком для розвитку сучасної робототехніки та створення надскладних симуляційних систем, здатних ефективно взаємодіяти з реальним середовищем у майбутньому.

15 Перегляди

Джерела

  • Cadena 3 Argentina

  • The Tech Buzz

  • The Tech Buzz

  • Android Authority

  • The Tech Buzz

  • Google DeepMind: The Podcast

Знайшли помилку чи неточність?Ми розглянемо ваші коментарі якомога швидше.