Google Ra Mắt Mô Hình Video AI Veo 3.1 Kèm Công Cụ Flow Thế Hệ Mới và Âm Thanh Sống Động Hơn

Chỉnh sửa bởi: Veronika Radoslavskaya

Lĩnh vực sáng tạo nội dung số đang chứng kiến một sự chuyển đổi đáng kể sau khi Google giới thiệu mô hình tạo video bằng trí tuệ nhân tạo mới nhất của mình, Veo 3.1, cùng với những cải tiến lớn cho bộ công cụ làm phim tích hợp Flow. Sự phát triển này đại diện cho việc hiệu chỉnh lại đáng kể các công cụ sáng tạo, mang đến cho những người kể chuyện bằng hình ảnh phương tiện để hiện thực hóa các ý tưởng phức tạp với độ chân thực và khả năng kiểm soát cao hơn so với trước đây. Trọng tâm của thông báo này là cung cấp tính chân thực được cải thiện, khả năng đồng bộ hóa âm thanh tinh vi, và sự nắm bắt sâu sắc, trực quan hơn về cấu trúc kể chuyện trong khuôn khổ AI.

Veo 3.1 được xây dựng dựa trên nền tảng của mô hình Veo 3 ban đầu, vốn đã được giới thiệu lần đầu vào tháng 5 năm 2025. Phiên bản mới này tinh chỉnh đầu ra hình ảnh thông qua khả năng kết xuất kết cấu vượt trội và ánh sáng môi trường được điều chỉnh sắc thái hơn, đẩy công nghệ tiến gần hơn đến chủ nghĩa siêu thực ảnh. Điều quan trọng là, mô hình này giờ đây vượt trội trong việc tạo ra âm thanh tiên tiến, đảm bảo rằng các hiệu ứng âm thanh và lời thoại được đồng bộ hóa một cách phức tạp với hành động trực quan, giải quyết vấn đề mất tính nhập vai phổ biến trong các hệ thống tạo sinh trước đây. AI cũng thể hiện sự hiểu biết sâu sắc hơn về ngôn ngữ điện ảnh, cho phép nó tuân thủ chặt chẽ hơn các yêu cầu về phong cách cụ thể. Một phiên bản Veo 3.1 Fast cũng được cung cấp cho người dùng.

Sức mạnh tạo sinh được nâng cao này được truyền tải trực tiếp thông qua công cụ làm phim Flow đã được cập nhật, công cụ này đã tạo ra hơn 275 triệu video kể từ khi ra mắt. Hiện tại, các nhà sáng tạo có thể sử dụng một bộ chức năng mới mạnh mẽ được thiết kế để hợp lý hóa các nhiệm vụ sản xuất phức tạp. Tính năng 'Ingredients to Video' (Thành phần thành Video) cho phép người dùng nhập nhiều hình ảnh tham chiếu, thiết lập tính nhất quán về thiết kế nhân vật và tính thẩm mỹ thị giác trong suốt một chuỗi, giờ đây đã đi kèm với âm thanh phù hợp. Đối với các câu chuyện tham vọng hơn, tính năng 'Scene Extension' (Mở rộng Cảnh) cho phép kéo dài các clip được tạo ra, giảm thiểu các giới hạn về định dạng ngắn trước đây trong khi vẫn duy trì tính liên tục của âm thanh.

Công cụ Flow cũng giới thiệu các hình thức kiểm soát mới lạ, chẳng hạn như 'Frames to Video' (Khung hình thành Video), tạo ra chuyển động liền mạch giữa hai hình ảnh tĩnh do người dùng xác định, hoàn chỉnh với âm thanh được đồng bộ hóa. Hơn nữa, các công cụ thao tác đối tượng cho phép chèn hoặc loại bỏ các yếu tố trong một cảnh, với hệ thống tự động tính toán lại và áp dụng bóng đổ cũng như ánh sáng chân thực. Những khả năng này, bao gồm chèn và loại bỏ đối tượng, được định vị để xác định lại quy trình làm việc sáng tạo cho các nhà phát triển và người dùng doanh nghiệp truy cập công nghệ thông qua các nền tảng Gemini API và Vertex AI, cũng như các nhà sáng tạo cá nhân.

Bước nhảy vọt về công nghệ này nhấn mạnh cam kết của Google trong việc dân chủ hóa sản xuất video chất lượng cao, có sự hỗ trợ của AI bằng cách đặt quyền kiểm soát tinh vi trực tiếp vào tay các nhà tư tưởng sáng tạo. Việc tập trung vào giải quyết các vấn đề phức tạp về tính liên tục của hình ảnh, chẳng hạn như duy trì ánh sáng nhất quán trong quá trình chèn đối tượng, cho thấy sự hiểu biết về các yếu tố tinh tế giúp nâng tầm mô phỏng thành nghệ thuật hấp dẫn. Phân tích ngành đã chỉ ra rằng các mô hình đạt được tính nhất quán theo thời gian cao đang có tỷ lệ áp dụng cao cấp trong số các studio chuyên nghiệp, định vị sự nhấn mạnh của Veo 3.1 vào tính bền vững của đối tượng và mở rộng cảnh là cực kỳ phù hợp với cộng đồng sáng tạo chuyên nghiệp.

Nguồn

  • Beebom

  • 9to5Google

  • Google Developers Blog

  • TechCrunch

  • BGR

  • Google Cloud Blog

Bạn có phát hiện lỗi hoặc sai sót không?

Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.