Google DeepMind Abre Acesso Antecipado ao Protótipo 'Project Genie' para Assinantes do Gemini Ultra

Editado por: Veronika Radoslavskaya

No dia 29 de janeiro de 2026, a Google DeepMind anunciou oficialmente o início de uma fase de acesso antecipado limitado para o Project Genie, um protótipo de pesquisa experimental que promete transformar a interação entre humanos e inteligência artificial. Esta ferramenta inovadora está disponível exclusivamente para os assinantes do nível Gemini Ultra localizados nos Estados Unidos, permitindo que este grupo seleto explore as fronteiras da criação de ambientes digitais dinâmicos a partir de simples comandos de texto ou imagens estáticas.

A arquitetura tecnológica que sustenta o Project Genie é composta por uma integração sofisticada de três sistemas de inteligência artificial distintos, trabalhando em harmonia para gerar experiências imersivas. Esta estrutura híbrida foi projetada para superar as limitações das gerações anteriores de IA, focando na criação de mundos que não apenas parecem reais, mas que também respondem de forma lógica às ações dos usuários.

  • O Genie 3 atua como o Modelo de Mundo fundamental da DeepMind, sendo responsável por prever a progressão de cada quadro em uma sequência de vídeo com base na interação do usuário. Ele utiliza algoritmos avançados para simular um ambiente que mantém uma física simplificada, garantindo que o mundo gerado tenha uma continuidade visual e espacial coerente durante toda a exploração.
  • O Nano Banana Pro é uma variante do modelo de imagem Gemini, especificamente ajustada para converter as instruções iniciais do usuário em uma base visual de alta qualidade. Este componente é essencial para estabelecer o ponto de partida estético da simulação, transformando descrições abstratas em cenários detalhados que servem de palco para a exploração dinâmica.
  • O Gemini atua como o Orquestrador e motor de raciocínio do sistema, gerenciando a complexa lógica de interação e resposta. Ele é encarregado de controlar a perspectiva da câmera e as movimentações dos personagens, assegurando que a navegação pelo ambiente seja responsiva e que as ações do usuário sejam interpretadas de maneira inteligente dentro do contexto gerado.

Diferente dos motores de jogo 3D tradicionais que dependem de renderização de polígonos e geometria complexa, o Project Genie cria o que a DeepMind define como fluxos de vídeo interativos. O sistema gera uma corrente contínua de quadros em tempo real que se adaptam instantaneamente aos comandos de controle, resultando em uma experiência de exploração fluida e quase onírica, onde o ambiente parece se materializar e reagir diante dos olhos do espectador.

Apesar do seu potencial revolucionário, esta fase experimental do Project Genie opera sob restrições técnicas específicas, necessárias para gerenciar a alta demanda de processamento computacional exigida pela geração de vídeo em tempo real. Estas limitações são fundamentais para garantir que a equipe de pesquisa possa monitorar o desempenho do sistema de forma controlada enquanto coleta dados valiosos para o futuro.

  • As sessões de interação são rigorosamente limitadas a uma duração máxima de 60 segundos por vez. Este limite temporal é imposto devido à intensidade computacional massiva necessária para sustentar a geração de ambientes em tempo real sem comprometer a estabilidade dos servidores.
  • Em termos de especificações visuais, os ambientes são apresentados em uma resolução de 720p com uma taxa de atualização de 24 quadros por segundo (FPS). Essas métricas foram escolhidas para equilibrar a qualidade visual com a necessidade de uma resposta imediata aos comandos do usuário durante esta fase inicial de testes públicos.
  • A plataforma também oferece uma funcionalidade inovadora de "remixagem", que permite aos usuários pegar uma geração existente e aplicar modificações criativas. Através deste recurso, é possível alterar o estilo artístico ou até mesmo redefinir as regras ambientais de um mundo que já foi previamente construído pelo sistema, ampliando as possibilidades de experimentação.

Shlomi Fruchter, Diretor de Pesquisa da DeepMind, destacou que o principal objetivo deste protótipo é revelar capacidades interativas sem precedentes que não podem ser replicadas por métodos de renderização convencionais. Ao abrir o acesso ao público, a Google DeepMind pretende coletar um volume massivo de dados de treinamento que serão vitais para o aprimoramento contínuo da inteligência artificial.

O foco central desta iniciativa é refinar a compreensão da IA sobre a física e a lógica espacial, elementos considerados pilares para o desenvolvimento futuro de agentes de IA incorporada. Esses avanços são vistos como passos essenciais para a criação de robôs e sistemas de simulação complexos que possam operar de forma autônoma e segura no mundo real, marcando um capítulo decisivo na trajetória da inteligência artificial moderna e da robótica avançada.

15 Visualizações

Fontes

  • Cadena 3 Argentina

  • The Tech Buzz

  • The Tech Buzz

  • Android Authority

  • The Tech Buzz

  • Google DeepMind: The Podcast

Encontrou um erro ou imprecisão?Vamos considerar seus comentários assim que possível.