Vào ngày 5 tháng 8 năm 2025, Google DeepMind đã giới thiệu Genie 3, một mô hình AI tiên tiến có khả năng tạo ra các môi trường 3D tương tác theo thời gian thực. Đây là một bước tiến quan trọng, cho phép cả con người và các tác nhân AI di chuyển và tương tác trong các thế giới ảo được tạo ra một cách liền mạch.
Genie 3 cải tiến đáng kể so với phiên bản tiền nhiệm, Genie 2, bằng cách tạo ra các môi trường 3D tương tác kéo dài vài phút với tốc độ 24 khung hình/giây ở độ phân giải 720p. Khả năng này cho phép tạo ra các thế giới ảo phong phú và nhất quán hơn, vượt xa giới hạn chỉ vài giây của các mô hình trước đó. Một tính năng nổi bật của Genie 3 là khả năng duy trì tính nhất quán về mặt vật lý và ghi nhớ các tương tác trước đó, tạo ra các kịch bản sống động và đáng tin cậy hơn. Mô hình này còn được trang bị tính năng "sự kiện thế giới kích hoạt bằng lệnh", cho phép người dùng thay đổi môi trường bằng các câu lệnh văn bản. Điều này mở ra khả năng tùy chỉnh và điều khiển thế giới ảo một cách trực quan, tương tự như cách con người học hỏi và thích ứng với môi trường xung quanh.
Shlomi Fruchter, Giám đốc Nghiên cứu của DeepMind, đã mô tả Genie 3 là "mô hình thế giới đa năng tương tác thời gian thực đầu tiên". Khả năng này có tiềm năng cách mạng hóa việc đào tạo các tác nhân AI, cho phép chúng học hỏi từ kinh nghiệm của chính mình trong các môi trường mô phỏng phức tạp và đa dạng. Điều này được xem là một bước đệm quan trọng trên con đường phát triển Trí tuệ Nhân tạo Tổng quát (AGI). Google DeepMind hiện đang cung cấp Genie 3 dưới dạng bản xem trước nghiên cứu giới hạn, với kế hoạch mở rộng quyền truy cập cho nhiều đối tượng hơn trong tương lai. Sự phát triển này không chỉ hứa hẹn thúc đẩy các ứng dụng trong lĩnh vực trò chơi điện tử và giáo dục mà còn mở ra những khả năng mới cho việc mô phỏng, đào tạo AI và sáng tạo nội dung số, đánh dấu một kỷ nguyên mới trong việc tương tác với thế giới ảo.