Google đã giới thiệu Veo 3, một mô hình AI tiên tiến có khả năng tạo video từ văn bản, tại sự kiện Google I/O thường niên của mình ở Mountain View, Hoa Kỳ. Phiên bản mới này diễn giải những câu chuyện ngắn do người dùng viết và chuyển chúng thành các đoạn phim với hình ảnh động, biểu cảm khuôn mặt và âm thanh được tích hợp vào câu chuyện. Veo 3 bao gồm âm thanh đồng bộ với hình ảnh, chẳng hạn như các đoạn hội thoại giữa các nhân vật, âm thanh xung quanh và hiệu ứng âm thanh. Điều này thể hiện một bước tiến đáng kể so với phiên bản tiền nhiệm, với khả năng hiểu và chuyển đổi các mô tả phức tạp thành các cảnh thực tế với vật lý chi tiết, chuyển động tự nhiên và âm thanh xung quanh. Được phát triển với sự hợp tác của các chuyên gia điện ảnh, âm nhạc và nghệ thuật thị giác, Veo 3 tích hợp công nghệ SynthID để đánh dấu kỹ thuật số nội dung do AI tạo ra, ngăn chặn thông tin sai lệch. Veo 3 hiện có sẵn ở Hoa Kỳ thông qua ứng dụng Gemini cho người đăng ký Ultra và cho các doanh nghiệp thông qua Vertex AI. Nó cũng có thể được sử dụng trên Flow, nền tảng mới của Google để sản xuất phim có sự hỗ trợ của AI.
Google ra mắt Veo 3: Mô hình AI tạo video với âm thanh đồng bộ
Chỉnh sửa bởi: Veronika Nazarova
Nguồn
Visão
Đọc thêm tin tức về chủ đề này:
Bạn có phát hiện lỗi hoặc sai sót không?
Chúng tôi sẽ xem xét ý kiến của bạn càng sớm càng tốt.