Yandex запускає набір даних Yambda для досліджень систем музичних рекомендацій

21:53, 30 травня

Відредаговано: Veronika Radoslavskaya

Yandex представила Yambda, великий публічний набір даних для розвитку досліджень у галузі систем рекомендацій. Цей набір даних, випущений у травні 2025 року, призначений для поєднання академічних досліджень із реальними промисловими застосуваннями. Він містить майже 5 мільярдів анонімних подій взаємодії користувачів із Yandex Music.

Набір даних Yambda містить 4,79 мільярда анонімних взаємодій користувачів, зібраних протягом десяти місяців приблизно від 1 мільйона користувачів, які взаємодіяли з приблизно 9,4 мільйонами треків. Щоб захистити конфіденційність, усі ідентифікатори користувачів і треків анонімізовано за допомогою числових ідентифікаторів.

Yandex надає базові моделі рекомендацій, реалізовані на наборі даних, включаючи колаборативну фільтрацію на основі елементів, матричну факторизацію та нейронну колаборативну фільтрацію. Набір даних доступний у трьох розмірах через Hugging Face, що задовольняє різні дослідницькі потреби та обчислювальні можливості.

Джерела

MarkTechPost
Yandex
Yandex
arXiv
Yandex
Hugging Face
MarkTechPost

Читайте більше новин на цю тему:

31 травня

Hugging Face запускає у 2025 році гуманоїдних роботів зі штучним інтелектом з відкритим кодом HopeJR і Reachy Mini

30 травня

Manus Slides: Інструмент штучного інтелекту створює презентації за одним запитом

30 травня

Тиждень технологій у Нью-Йорку 2025: Події зі штучного інтелекту та робототехніки домінують у Нью-Йорку

Знайшли помилку чи неточність?

Ми розглянемо ваші коментарі якомога швидше.