2026 年,自動化音樂美學評估領域邁向了全新境界:國際會議 ICASSP 正式啟動了 Automatic Song Aesthetics Evaluation Challenge。
此項競賽的任務是訓練演算法預測人類對音樂作品的美學評價。這並非關於音樂創作。
這是一次試圖理解音樂為何動聽的嘗試。
當音樂成為機器的感知對象
近年來,人工智慧已積極學習如何生成聲音:
旋律
和聲
音色
人聲
然而這項新任務的切入點截然不同:演算法是否能像聽眾一樣評估音樂性?
這正是 ICASSP 2026 挑戰賽的核心主題。
參賽模型需分析音訊片段,並嘗試根據數個感知參數來預測人類的美學評分:
聲音完整性
聽感自然度
記憶點
聲音清晰度
音樂性
這些參數反映的並非錄音的技術品質,而是人類感知音樂的方式。
從生成轉向感知
這是音樂人工智慧發展過程中的重大轉折。
如果說過去的系統是在學習創造聲音,那麼現在它們則是在學習詮釋聲音的美學意義。
實際上,這象徵著一種轉變:從合成到理解,從「演算法表演者」
到「演算法聽眾」。
音樂美學成為可量化的研究領域
ICASSP 2026 挑戰賽延續了先前在 SongEval 2025 資料集框架下開啟的研究方向,該資料集首度彙整了大規模的人類音樂片段美學評估數據庫。
如今,此領域已提升至國際模型競賽的層次。
這意味著:音樂之美正逐漸成為計算分析的對象,
同時依然保有其作為人類情感體驗的本質。
共同聆聽的空間
與此同時,倫敦瑪麗王后大學與倫敦帝國學院的研究團隊也持續深入探討音樂感知,以及聽眾與科技生成的音樂之間的互動。
音樂聆聽已日益成為人類與演算法交會的互動空間。
這並非取代,而是合作。
這為世界的聲音帶來了什麼
現今演算法首度不再僅僅學習如何發聲。
它們正學著如何傾聽。而在這股趨勢下,音樂正逐漸超越單純的表演藝術,成為一門感知的科學,讓人類與科技得以共同聆賞。




