Google chính thức ra mắt Lyria 3: Biến Gemini thành phòng thu âm nhạc AI chuyên nghiệp

17:29, 18 tháng 2

Tác giả: Veronika Radoslavskaya

iframe { display: none; }

Google chính thức ra mắt Lyria 3: Biến Gemini thành phòng thu âm nhạc AI chuyên nghiệp

Vào ngày 18 tháng 2 năm 2026, Google DeepMind đã đánh dấu một bước tiến khổng lồ trong lĩnh vực sáng tạo kỹ thuật số khi công bố triển khai Lyria 3 trên toàn cầu. Đây là mô hình tạo nhạc tiên tiến nhất của hãng tính đến thời điểm hiện tại, vượt xa các phiên bản thử nghiệm trước đó để mang đến một giải pháp sản xuất âm nhạc toàn diện. Hiện nay, Google đã tích hợp trực tiếp công cụ này vào giao diện web và ứng dụng Gemini, chính thức biến chatbot này thành một studio âm nhạc chuyên nghiệp cho người dùng khắp thế giới.

iframe { display: none; }

Lyria 3 không chỉ đơn thuần là một bản cập nhật kỹ thuật mà còn là một sự lột xác về tính năng, cho phép người dùng tương tác với âm nhạc theo những cách chưa từng có. Sự nâng cấp này giúp xóa nhòa ranh giới giữa ý tưởng sơ khai và một bản thu âm hoàn chỉnh, chất lượng cao, mang lại khả năng sáng tạo vô hạn cho cả những người không có chuyên môn về nhạc lý.

Một trong những điểm đột phá nhất của Lyria 3 chính là khả năng xử lý đầu vào đa phương thức. Người dùng giờ đây không còn bị giới hạn trong việc nhập các câu lệnh văn bản khô khan. Mô hình có thể phân tích các tệp ảnh hoặc video được tải lên để tự động tạo ra nhạc nền phù hợp với nhịp điệu và cảm xúc của hình ảnh. Ví dụ, khi quét một đoạn video về con phố dưới mưa, hệ thống có thể ngay lập tức đề xuất và tạo ra một bản nhạc lo-fi jazz đầy tâm trạng.

Bên cạnh khả năng tạo nhạc cụ, Lyria 3 còn có thể tự viết lời bài hát và mô phỏng giọng hát của con người một cách chân thực. Hiện tại, công cụ này hỗ trợ tạo giọng hát bằng 8 ngôn ngữ khác nhau, bao gồm tiếng Anh, tiếng Tây Ban Nha, tiếng Nhật, tiếng Hàn và tiếng Hindi. Đặc biệt, tiếng Ả Rập cũng đã được đưa vào thử nghiệm dưới dạng phiên bản beta, mở ra cơ hội sáng tạo âm nhạc đa văn hóa cho người dùng trên toàn cầu.

Để đáp ứng nhu cầu của những người làm nhạc chuyên nghiệp, Google đã bổ sung các bảng điều khiển chi tiết cho phép điều chỉnh nhịp độ (tempo), phong cách thể loại và mật độ nhạc cụ trong bản phối. Mô hình có khả năng tạo ra các đoạn nhạc chất lượng cao dài 30 giây. Những đoạn clip này có thể được mở rộng hoặc lặp lại một cách mượt mà để tạo thành một bài hát hoàn chỉnh mà không để lại bất kỳ dấu vết cắt ghép nào.

Nhằm cung cấp một gói giải pháp sáng tạo trọn gói, Google đã tích hợp mô hình tạo hình ảnh mới nhất của mình với mã nội bộ là "Nano Banana". Đây là một phần thuộc dòng Gemini 2.5 Flash Image, có nhiệm vụ tự động phân tích ca từ và cảm xúc của bản nhạc vừa tạo để thiết kế nên những tác phẩm nghệ thuật bìa album độc bản và chất lượng cao cho mỗi bài hát, giúp người dùng có ngay một sản phẩm hoàn thiện để chia sẻ.

Song song với việc phát triển công nghệ, Google cũng đặc biệt nhấn mạnh rằng Lyria 3 được huấn luyện dựa trên sự tuân thủ nghiêm ngặt các quy định về bảo vệ bản quyền và an toàn cho nghệ sĩ. Hãng cam kết xây dựng một hệ sinh thái âm nhạc AI lành mạnh, nơi công nghệ hỗ trợ thay vì thay thế hoặc xâm phạm quyền lợi của các nhà sáng tạo nội dung truyền thống.

Hệ thống được trang bị các rào cản chống bắt chước (Anti-Mimicry Guardrails) cực kỳ tinh vi để bảo vệ danh tiếng của các nghệ sĩ. Lyria 3 sẽ tự động từ chối các yêu cầu sao chép phong cách hoặc giọng hát của các cá nhân cụ thể. Nếu người dùng yêu cầu một bản nhạc "theo phong cách của Taylor Swift", hệ thống sẽ chỉ sử dụng truy vấn đó như một nguồn cảm hứng sáng tạo chung, đảm bảo không sao chép giọng hát hay các cấu trúc giai điệu đặc trưng mang tính thương hiệu của nữ ca sĩ.

Để tăng cường tính minh bạch trong kỷ nguyên số, tất cả các sản phẩm âm thanh đầu ra đều được nhúng SynthID. Đây là một loại mã xác thực vô hình nhưng có thể phát hiện được ngay cả khi tệp âm thanh bị nén, chỉnh sửa hoặc phối lại. Công nghệ này đảm bảo rằng các nội dung do AI tạo ra luôn có thể được nhận diện và truy xuất nguồn gốc một cách chính xác, giúp ngăn chặn việc lạm dụng nội dung giả mạo.

Tính năng này đã bắt đầu được triển khai từ hôm nay cho người dùng Gemini từ 18 tuổi trở lên trên phạm vi toàn cầu. Với bước đi chiến lược này, Google đang định vị Lyria 3 là đối thủ cạnh tranh trực tiếp với các dịch vụ như Suno và Udio. Bằng cách tận dụng hệ sinh thái tích hợp sâu rộng của mình, Google kỳ vọng sẽ mang các công cụ sáng tạo âm nhạc tiên tiến nhất đến với đại đa số công chúng, xóa bỏ mọi rào cản kỹ thuật trong việc sáng tác nghệ thuật.

Việc ra mắt Lyria 3 cho thấy tầm nhìn của Google trong việc kết hợp trí tuệ nhân tạo vào đời sống tinh thần và giải trí. Không chỉ dừng lại ở việc hỗ trợ công việc văn phòng hay tìm kiếm thông tin, Gemini giờ đây đã trở thành một người bạn đồng hành trong nghệ thuật, giúp bất kỳ ai cũng có thể hiện thực hóa những giai điệu trong đầu mình thành những tác phẩm âm nhạc thực thụ.

Sự xuất hiện của các công cụ như Nano Banana đi kèm cũng minh chứng cho khả năng phối hợp đa mô hình mạnh mẽ của Google. Việc kết hợp giữa âm thanh, văn bản và hình ảnh trong một quy trình duy nhất hứa hẹn sẽ tạo ra một làn sóng nội dung số mới mẻ, phong phú và đầy tính cá nhân hóa trong tương lai gần, đồng thời thiết lập những tiêu chuẩn mới cho ngành công nghiệp âm nhạc AI.