Yandex 發布 Yambda 數據集,用於音樂推薦系統研究

编辑者: Veronika Radoslavskaya

Yandex 推出了大型公共數據集 Yambda,旨在推動推薦系統研究。該數據集於 2025 年 5 月發布,旨在將學術研究與現實世界的行業應用聯繫起來。它包含來自 Yandex Music 的近 50 億次匿名用戶互動事件。

Yambda 數據集包含 47.9 億次匿名用戶互動,這些互動是在十個月內從大約 100 萬用戶與大約 940 萬首曲目的互動中收集的。為了保護隱私,所有用戶和曲目標識符都使用數字 ID 進行了匿名化處理。

Yandex 提供了在該數據集上實施的基準推薦模型,包括基於項目的協同過濾、矩陣分解和神經協同過濾。該數據集通過 Hugging Face 提供三種尺寸,以滿足各種研究需求和計算能力。

來源

  • MarkTechPost

  • Yandex

  • Yandex

  • arXiv

  • Yandex

  • Hugging Face

  • MarkTechPost

发现错误或不准确的地方吗?

我们会尽快处理您的评论。

Yandex 發布 Yambda 數據集,用於音樂推薦系統研究 | Gaya One