Google DeepMind prezentuje Genie 3: AI tworzy interaktywne światy 3D z opisów tekstowych

Edytowane przez: Olga Sukhina

Google DeepMind zaprezentowało Genie 3, zaawansowany model sztucznej inteligencji zdolny do generowania interaktywnych środowisk 3D na podstawie opisów tekstowych. Technologia ta umożliwia tworzenie i eksplorację dynamicznych wirtualnych światów w czasie rzeczywistym, z rozdzielczością 720p i płynnością 24 klatek na sekundę, zachowując spójność przez kilka minut.

Genie 3 pozwala użytkownikom na błyskawiczne budowanie i nawigowanie po dynamicznych przestrzeniach 3D, utrzymując spójność środowiska przez dłuższy czas, co umożliwia pogłębioną eksplorację. Model obsługuje modyfikacje świata w czasie rzeczywistym, takie jak zmiany pogody czy wprowadzanie nowych postaci. Potencjalne zastosowania obejmują branże gier, edukacji oraz szkolenia agentów AI. W porównaniu do poprzednich wersji, takich jak Genie 2, nowy model oferuje dłuższy czas interakcji i wyższą rozdzielczość, wykorzystując architekturę autoregresyjną podobną do tej stosowanej w dużych modelach językowych. Obecnie Genie 3 jest dostępny w ramach ograniczonego podglądu badawczego dla wybranych akademików i twórców, a Google DeepMind monitoruje jego wykorzystanie pod kątem bezpieczeństwa i odpowiedzialnego stosowania. Do ograniczeń należą niedoskonałości w dokładności fizyki przy złożonych interakcjach między wieloma agentami oraz renderowaniu tekstu.

Źródła

  • Tom's Guide

  • Google DeepMind's Official Announcement on Genie 3

  • India Today's Coverage on Genie 3

  • The Times of India's Article on Genie 3

  • PC Gamer's Report on Genie 3

  • Google DeepMind's LinkedIn Post on Genie 3

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.