Google DeepMind zaprezentowało Genie 3, zaawansowany model sztucznej inteligencji zdolny do generowania interaktywnych środowisk 3D na podstawie opisów tekstowych. Technologia ta umożliwia tworzenie i eksplorację dynamicznych wirtualnych światów w czasie rzeczywistym, z rozdzielczością 720p i płynnością 24 klatek na sekundę, zachowując spójność przez kilka minut.
Genie 3 pozwala użytkownikom na błyskawiczne budowanie i nawigowanie po dynamicznych przestrzeniach 3D, utrzymując spójność środowiska przez dłuższy czas, co umożliwia pogłębioną eksplorację. Model obsługuje modyfikacje świata w czasie rzeczywistym, takie jak zmiany pogody czy wprowadzanie nowych postaci. Potencjalne zastosowania obejmują branże gier, edukacji oraz szkolenia agentów AI. W porównaniu do poprzednich wersji, takich jak Genie 2, nowy model oferuje dłuższy czas interakcji i wyższą rozdzielczość, wykorzystując architekturę autoregresyjną podobną do tej stosowanej w dużych modelach językowych. Obecnie Genie 3 jest dostępny w ramach ograniczonego podglądu badawczego dla wybranych akademików i twórców, a Google DeepMind monitoruje jego wykorzystanie pod kątem bezpieczeństwa i odpowiedzialnego stosowania. Do ograniczeń należą niedoskonałości w dokładności fizyki przy złożonych interakcjach między wieloma agentami oraz renderowaniu tekstu.