Yandex lance Yambda, un ensemble de données pour la recherche sur les systèmes de recommandation musicale

Édité par : Veronika Radoslavskaya

Yandex a lancé Yambda, un vaste ensemble de données public destiné à faire progresser la recherche sur les systèmes de recommandation. Publié en mai 2025, cet ensemble de données est conçu pour relier la recherche académique aux applications industrielles réelles. Il comprend près de 5 milliards d'événements d'interaction utilisateur anonymisés provenant de Yandex Music.

L'ensemble de données Yambda comprend 4,79 milliards d'interactions utilisateur anonymisées collectées sur dix mois auprès d'environ 1 million d'utilisateurs interagissant avec environ 9,4 millions de pistes. Pour protéger la vie privée, tous les identifiants d'utilisateurs et de pistes sont anonymisés à l'aide d'ID numériques.

Yandex fournit des modèles de recommandation de base implémentés sur l'ensemble de données, notamment le filtrage collaboratif basé sur les éléments, la factorisation matricielle et le filtrage collaboratif neuronal. L'ensemble de données est disponible en trois tailles via Hugging Face, pour répondre aux divers besoins de recherche et aux capacités de calcul.

Sources

  • MarkTechPost

  • Yandex

  • Yandex

  • arXiv

  • Yandex

  • Hugging Face

  • MarkTechPost

Avez-vous trouvé une erreur ou une inexactitude ?

Nous étudierons vos commentaires dans les plus brefs délais.

Yandex lance Yambda, un ensemble de donnée... | Gaya One