Vào năm 2026, lĩnh vực đánh giá thẩm mỹ âm nhạc tự động đã tiến lên một tầm cao mới với việc khởi động cuộc thi Automatic Song Aesthetics Evaluation Challenge trong khuôn khổ hội nghị quốc tế ICASSP.
Nhiệm vụ của cuộc thi là dạy các thuật toán cách dự đoán những đánh giá thẩm mỹ của con người đối với các tác phẩm âm nhạc. Đây không phải là câu chuyện về việc sáng tạo âm nhạc.
Đây là nỗ lực nhằm thấu hiểu lý do tại sao âm nhạc lại trở nên đẹp đẽ.
Khi âm nhạc trở thành đối tượng cảm thụ của máy móc
Trong những năm gần đây, trí tuệ nhân tạo đã tích cực học cách tạo ra âm thanh:
giai điệu
hòa âm
âm sắc
giọng hát
Thế nhưng, nhiệm vụ mới lại mang một sắc thái khác: liệu thuật toán có thể đánh giá tính nhạc giống như một thính giả thực thụ?
Đó chính là mục tiêu cốt lõi của cuộc thi ICASSP 2026.
Các mô hình sẽ tiếp nhận các đoạn âm thanh và cố gắng dự đoán đánh giá thẩm mỹ của con người dựa trên một số thông số tri giác:
tính toàn vẹn của âm thanh
độ tự nhiên của âm thanh
khả năng gây ấn tượng
độ trong trẻo của âm thanh
tính nhạc
Những thông số này không phản ánh chất lượng kỹ thuật của bản ghi, mà thể hiện cách âm nhạc được con người cảm nhận.
Từ tạo tác đến cảm thụ
Đây là một bước ngoặt quan trọng trong sự phát triển của trí tuệ nhân tạo trong âm nhạc.
Nếu trước đây các hệ thống học cách tạo ra âm thanh, thì giờ đây chúng đang học cách diễn giải giá trị thẩm mỹ của âm thanh đó.
Thực tế, đây là một sự chuyển dịch: từ tổng hợp đến thấu hiểu, từ thuật toán biểu diễn
sang thuật toán lắng nghe
Thẩm mỹ âm nhạc trở thành một lĩnh vực nghiên cứu có thể đo lường
Thử thách ICASSP 2026 tiếp nối sự phát triển của hướng đi đã được khởi xướng trước đó thông qua bộ dữ liệu SongEval 2025, nơi lần đầu tiên một cơ sở dữ liệu lớn về các đánh giá thẩm mỹ của con người đối với các đoạn nhạc được thu thập.
Giờ đây, lĩnh vực này đang tiến tới cấp độ của một cuộc tranh tài mô hình mang tầm quốc tế.
Điều này có nghĩa là: vẻ đẹp âm nhạc đang dần trở thành đối tượng của phân tích tính toán
đồng thời vẫn giữ nguyên giá trị như một trải nghiệm của con người.
Không gian đồng cảm thụ
Song song với đó, các nhóm nghiên cứu tại Đại học Queen Mary London và Đại học Hoàng gia London đang tiếp tục tìm hiểu về sự cảm thụ âm nhạc và tương tác của người nghe với âm nhạc được tạo ra bởi công nghệ.
Việc thưởng thức âm nhạc đang ngày càng trở thành không gian tương tác giữa con người và thuật toán.
Không phải là sự thay thế, mà là sự hợp tác.
Điều này mang lại gì cho âm hưởng của hành tinh
Ngày nay, lần đầu tiên các thuật toán không chỉ học cách phát ra âm thanh.
Chúng đang học cách lắng nghe. Và trong xu thế này, âm nhạc dần trở thành không chỉ là nghệ thuật biểu diễn — mà còn là khoa học về sự cảm thụ, nơi con người và công nghệ bắt đầu cùng nhau thấu cảm.




