2026年,音乐审美自动评估领域迈向了新高度:国际声学、语音与信号处理会议(ICASSP)正式启动了歌曲审美自动评估挑战赛(Automatic Song Aesthetics Evaluation Challenge)。
该赛事的任务是训练算法预测人类对音乐作品的审美评价。这并非关乎音乐创作。
其核心在于尝试理解,音乐之美究竟源于何处。
当音乐成为机器感知的对象
近年来,人工智能一直在积极学习声音生成:
旋律
和声
音色
人声
但这项新任务的本质完全不同:算法能否像听众一样评估音乐性?
这正是 ICASSP 2026 挑战赛所关注的焦点。
模型在接收音频片段后,需尝试根据多个感知维度预测人类的审美评分:
声音完整性
声音自然度
记忆点
音质清晰度
音乐性
这些参数反映的并非录音的技术质量,而是人类对音乐的实际感受。
从生成走向感知
这是音乐人工智能发展历程中的一个重要转折点。
如果说以往的系统侧重于学习创造声音,那么现在的系统则开始学习解读其背后的审美价值。
事实上,这标志着一种转变:从合成到理解,从“算法演奏者”
向“算法听众”的跨越。
音乐审美正成为可量化的研究领域
ICASSP 2026 挑战赛延续了 SongEval 2025 数据集开创的研究方向,该数据集首次大规模收集了人类对音乐片段的审美评价。
如今,这一领域已上升至国际模型竞赛的高度。
这意味着:音乐之美正逐渐成为计算分析的对象
同时依然保留着作为人类情感体验的本质。
共同倾听的空间
与此同时,伦敦玛丽女王大学和伦敦帝国理工学院的研究团队正在深入探究音乐感知,以及听众与技术生成的音乐之间的交互。
音乐聆听正日益演变为人类与算法互动的空间。
这不是取代,而是协作。
这为世界的乐章增添了什么
如今,算法第一次不仅仅是在学习如何发声。
它们正在学习倾听。在这种趋势下,音乐正逐渐超越单纯的表演艺术,演变为一门感知科学,让人类与技术在共鸣中一同聆听。




