Google DeepMind Ra Mắt Genie 3: AI Tạo Thế Giới 3D Tương Tác Từ Văn Bản

Chỉnh sửa bởi: Olga Sukhina

Google DeepMind vừa giới thiệu Genie 3, một mô hình trí tuệ nhân tạo (AI) tiên tiến có khả năng tạo ra các môi trường 3D tương tác từ mô tả văn bản đơn giản. Công nghệ đột phá này cho phép tạo và khám phá các thế giới ảo này trong thời gian thực với độ phân giải 720p và tốc độ 24 khung hình/giây. Genie 3 cho phép người dùng xây dựng và điều hướng các không gian 3D động một cách tức thời, duy trì tính nhất quán của môi trường trong thời gian dài mà không bị suy giảm chất lượng hình ảnh.

Genie 3 hỗ trợ các sự kiện thế giới có thể được kích hoạt bằng văn bản, cho phép sửa đổi thời tiết hoặc giới thiệu nhân vật theo thời gian thực, mang đến khả năng tùy chỉnh trải nghiệm sâu sắc hơn. So với các phiên bản trước, Genie 3 vượt trội với khả năng tương tác kéo dài vài phút, cải thiện đáng kể so với giới hạn trước đó, nhờ vào một quy trình tự hồi quy mới giúp mô hình xử lý lại toàn bộ quỹ đạo hành động mỗi khung hình. Sự cải tiến này mang lại trải nghiệm liền mạch và chân thực hơn, gần giống với các trò chơi điện tử tương tác. Tiềm năng ứng dụng của Genie 3 rất rộng lớn, trải dài từ lĩnh vực trò chơi điện tử, giáo dục cho đến đào tạo tác nhân AI, và được xem là một bước tiến quan trọng trên con đường phát triển Trí tuệ Nhân tạo Tổng quát (AGI). Hiện tại, Genie 3 đang được cung cấp dưới dạng bản xem trước nghiên cứu giới hạn cho các học giả và nhà sáng tạo chọn lọc, trong khi Google DeepMind tiếp tục nghiên cứu và đánh giá các khía cạnh an toàn của công nghệ này trước khi phát hành rộng rãi hơn.

Nguồn

  • Tom's Guide

  • Google DeepMind's Official Announcement on Genie 3

  • India Today's Coverage on Genie 3

  • The Times of India's Article on Genie 3

  • PC Gamer's Report on Genie 3

  • Google DeepMind's LinkedIn Post on Genie 3

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.