Runway Gen-4.5 Vượt Mặt Các Ông Lớn Ngành, Chiếm Ngôi Đầu Bảng Xếp Hạng AI Video
Chỉnh sửa bởi: Veronika Radoslavskaya
Runway, một startup AI độc lập hàng đầu, vừa chính thức trình làng mô hình chuyển văn bản thành video mới nhất của mình, Runway Gen-4.5, gây ra một cơn địa chấn đáng kể trong bối cảnh cạnh tranh khốc liệt. Mô hình này hiện đang dẫn đầu bảng xếp hạng uy tín Artificial Analysis Text-to-Video benchmark với điểm số Elo ấn tượng là 1247. Thành tích này giúp Gen-4.5 đứng trên một chút so với các đối thủ nặng ký là Veo 3 của Google và Sora 2 Pro của OpenAI.
Chiến thắng này là minh chứng rõ ràng cho sự tập trung chiến lược của Runway vào việc xây dựng các công cụ có khả năng phản hồi nhanh, dễ kiểm soát và tích hợp sâu vào quy trình làm việc. Mô hình này được phát triển dựa trên sự hợp tác chặt chẽ với Nvidia, tận dụng phần cứng được tối ưu hóa để đạt hiệu suất cao nhất. Gen-4.5 được mô tả là có độ nhất quán về mặt hình ảnh và khả năng đáp ứng các chỉ dẫn của người dùng vượt trội hơn hẳn so với phiên bản tiền nhiệm. Mục tiêu là mang lại những sản phẩm chất lượng điện ảnh, mở rộng tối đa khả năng sáng tạo cho cả người làm nội dung cá nhân lẫn các doanh nghiệp lớn.
Điểm mạnh truyền thống của Runway nằm ở hệ sinh thái dựa trên trình duyệt toàn diện của họ. Hệ sinh thái này cho phép người dùng lặp lại ý tưởng nhanh chóng, kiểm soát chi tiết các chuyển động máy quay, và tích hợp liền mạch với các công cụ chỉnh sửa chuyên nghiệp hiện có. Chính những yếu tố này khiến Gen-4.5 trở thành lựa chọn ưu tiên cho các nhà sáng tạo độc lập và các agency nội dung, những người coi trọng quy trình làm việc linh hoạt hơn là cơ sở hạ tầng kỹ thuật phức tạp.
Tuy nhiên, dù đạt được những bước tiến kỹ thuật đáng kể, những thách thức cố hữu của ngành công nghiệp AI tạo sinh video vẫn còn đó. Runway thừa nhận rằng Gen-4.5 vẫn gặp phải những điểm yếu cơ bản mà tất cả các mô hình video hiện tại đang phải đối mặt. Cụ thể, mô hình này vẫn gặp khó khăn với vấn đề tính nhân quả (ví dụ: hệ thống không thể mô phỏng chính xác sự kiện vật lý như việc cánh cửa chỉ mở ra sau khi tay nắm được đẩy) và tính bền vững của vật thể (các vật thể có thể biến mất chốc lát khi bị che khuất).
Bên cạnh đó, mô hình còn thể hiện một hiện tượng gọi là “thiên vị thành công”, tức là nó mô phỏng các hành động thành công thường xuyên hơn mức thực tế. Những hạn chế dai dẳng này nhấn mạnh rằng ngành công nghiệp vẫn chưa đạt đến ngưỡng tạo ra các “mô hình thế giới” thực sự đáng tin cậy, có khả năng mô phỏng chính xác vật lý đời thực—một lĩnh vực mà Runway cam kết sẽ tiếp tục phát triển mạnh mẽ. Trong khi đó, sự cạnh tranh vẫn gay gắt trong các lĩnh vực chuyên biệt.
Các đối thủ như Veo 3 của Google vẫn giữ lợi thế về khả năng tái tạo hình ảnh siêu thực ở độ phân giải 4K chuyên dụng và tích hợp âm thanh gốc một cách tự nhiên. Trong khi đó, Sora 2 Pro lại tập trung vào việc mô phỏng vật lý phức tạp và duy trì tính nhất quán qua nhiều cảnh quay. Mô hình Gen-4.5 đang được triển khai dần dần và sẽ sớm có mặt cho tất cả người dùng của Runway trong những ngày tới, qua đó củng cố vị thế dẫn đầu của Runway trong nhóm các công cụ sáng tạo tích hợp hàng đầu thị trường.
Nguồn
WinBuzzer
Seeking Alpha
alphaXiv
Đọc thêm tin tức về chủ đề này:
Bạn có phát hiện lỗi hoặc sai sót không?
Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.
