Google DeepMind prezentuje Genie 3: AI tworzy interaktywne światy 3D z opisów tekstowych
Edytowane przez: Olga Sukhina
Google DeepMind zaprezentowało Genie 3, zaawansowany model sztucznej inteligencji zdolny do generowania interaktywnych środowisk 3D na podstawie opisów tekstowych. Technologia ta umożliwia tworzenie i eksplorację dynamicznych wirtualnych światów w czasie rzeczywistym, z rozdzielczością 720p i płynnością 24 klatek na sekundę, zachowując spójność przez kilka minut.
Genie 3 pozwala użytkownikom na błyskawiczne budowanie i nawigowanie po dynamicznych przestrzeniach 3D, utrzymując spójność środowiska przez dłuższy czas, co umożliwia pogłębioną eksplorację. Model obsługuje modyfikacje świata w czasie rzeczywistym, takie jak zmiany pogody czy wprowadzanie nowych postaci. Potencjalne zastosowania obejmują branże gier, edukacji oraz szkolenia agentów AI. W porównaniu do poprzednich wersji, takich jak Genie 2, nowy model oferuje dłuższy czas interakcji i wyższą rozdzielczość, wykorzystując architekturę autoregresyjną podobną do tej stosowanej w dużych modelach językowych. Obecnie Genie 3 jest dostępny w ramach ograniczonego podglądu badawczego dla wybranych akademików i twórców, a Google DeepMind monitoruje jego wykorzystanie pod kątem bezpieczeństwa i odpowiedzialnego stosowania. Do ograniczeń należą niedoskonałości w dokładności fizyki przy złożonych interakcjach między wieloma agentami oraz renderowaniu tekstu.
Źródła
Tom's Guide
Google DeepMind's Official Announcement on Genie 3
India Today's Coverage on Genie 3
The Times of India's Article on Genie 3
PC Gamer's Report on Genie 3
Google DeepMind's LinkedIn Post on Genie 3
Przeczytaj więcej wiadomości na ten temat:
Czy znalazłeś błąd lub niedokładność?
Rozważymy Twoje uwagi tak szybko, jak to możliwe.
