OpenAI Ra Mắt Sora 2: Bước Tiến Vượt Bậc Trong Công Nghệ Tạo Video và Âm Thanh AI

Chỉnh sửa bởi: Veronika Radoslavskaya

OpenAI vừa công bố Sora 2, một mô hình trí tuệ nhân tạo tiên tiến chuyên tạo nội dung video và âm thanh chân thực, đồng bộ. Phiên bản nâng cấp này, kế thừa từ Sora ban đầu ra mắt tháng 2 năm 2024, mang đến những cải tiến đáng kể về độ chính xác vật lý, tính chân thực và khả năng kiểm soát. Sora 2 mô phỏng thế giới vật lý với độ trung thực cao hơn, khắc phục các hạn chế trước đây về biến dạng vật thể phi thực tế. Mô hình thể hiện sự hiểu biết sâu sắc về các định luật vật lý, ví dụ, thay vì tự động đưa bóng vào rổ sau một cú ném trượt, Sora 2 mô phỏng cảnh quả bóng nảy ra khỏi bảng. Khả năng của Sora 2 còn được thể hiện qua việc tạo ra các cảnh phức tạp, bao gồm cả các chuỗi động tác chi tiết như bài thi thể dục dụng cụ Olympic hay vận động viên trượt băng nghệ thuật thực hiện cú nhảy ba vòng trên không cùng với chú mèo.

Không chỉ dừng lại ở hình ảnh, Sora 2 còn xuất sắc trong việc tạo ra các hiệu ứng âm thanh nền, lời thoại và hiệu ứng âm thanh tinh vi với độ chân thực cao, đồng bộ hoàn hảo với nội dung video. Thời lượng video được tạo có thể lên tới 16 giây. Đi kèm với sự phát triển này là ứng dụng Sora mới. Ứng dụng này biến việc sáng tạo video AI thành một trải nghiệm xã hội và cộng tác, cho phép người dùng tạo, chỉnh sửa và khám phá video trong một nguồn cấp dữ liệu tùy chỉnh. Tính năng 'cameos' nổi bật cho phép người dùng chèn hình ảnh chân thực của họ vào bất kỳ cảnh nào của Sora sau một lần ghi hình và ghi âm duy nhất để xác minh danh tính, nhằm thúc đẩy các kết nối sâu sắc hơn.

OpenAI đang triển khai các biện pháp an toàn mạnh mẽ để giải quyết các lo ngại tiềm ẩn như sự cô lập, nghiện và lan truyền nội dung kém chất lượng. Công ty tăng cường đội ngũ kiểm duyệt viên để xem xét nội dung về các vấn đề như bắt nạt và đã giới thiệu các biện pháp kiểm soát của phụ huynh thông qua ChatGPT. Để cân bằng giữa cá nhân hóa và an toàn, người dùng phải cung cấp bản ghi video và âm thanh để xác minh danh tính khi tạo cameos cá nhân hóa. Sora 2 ban đầu có sẵn miễn phí với giới hạn hào phóng.

Sự ra đời của Sora 2 và ứng dụng đi kèm đánh dấu một thời điểm quan trọng trong sự phát triển của việc sáng tạo đa phương tiện dựa trên AI. Nó mở ra những con đường mới cho biểu đạt sáng tạo và nhấn mạnh sự tích hợp ngày càng tăng của các công cụ AI tinh vi vào các sản phẩm tiêu dùng, định hình lại bối cảnh nội dung kỹ thuật số. Cam kết của OpenAI trong việc thúc đẩy khả năng mô phỏng thế giới là điều hiển nhiên, định vị Sora 2 như một bước tiến quan trọng hướng tới các mô hình AI hiểu sâu sắc và tương tác với thế giới vật lý. Khả năng tạo ra các đối thoại và hiệu ứng âm thanh đồng bộ, tuân thủ các chỉ dẫn phức tạp và duy trì trạng thái thế giới chính xác qua nhiều cảnh quay cũng là những điểm đáng chú ý. Ngoài ra, Sora 2 còn có khả năng mô phỏng các tình huống thất bại, điều này rất quan trọng cho một trình mô phỏng thế giới hữu ích, cho phép tạo ra các chuyển động tự nhiên và tương tác chân thực hơn.

Nguồn

  • NBC News

  • OpenAI Releases Sora 2: Advanced AI Video and Audio Generation App

  • OpenAI Is Preparing to Launch a Social App for AI-Generated Videos

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.