Yandex udostępnia zbiór danych Yambda do badań nad systemami rekomendacji muzyki

21:53, 30 maja

Edytowane przez: Veronika Radoslavskaya

Yandex wprowadził Yambda, duży publiczny zbiór danych mający na celu rozwój badań nad systemami rekomendacji. Udostępniony w maju 2025 roku zbiór danych ma na celu połączenie badań akademickich z rzeczywistymi zastosowaniami przemysłowymi. Zawiera on prawie 5 miliardów anonimowych zdarzeń interakcji użytkowników z Yandex Music.

Zbiór danych Yambda zawiera 4,79 miliarda anonimowych interakcji użytkowników zebranych w ciągu dziesięciu miesięcy od około 1 miliona użytkowników korzystających z około 9,4 miliona utworów. W celu ochrony prywatności wszystkie identyfikatory użytkowników i utworów są anonimizowane za pomocą numerycznych identyfikatorów.

Yandex udostępnia podstawowe modele rekomendacji zaimplementowane na zbiorze danych, w tym filtrowanie oparte na elementach, faktoryzację macierzy i neuronowe filtrowanie kolaboratywne. Zbiór danych jest dostępny w trzech rozmiarach za pośrednictwem Hugging Face, dostosowanych do różnych potrzeb badawczych i możliwości obliczeniowych.

Źródła

MarkTechPost
Yandex
Yandex
arXiv
Yandex
Hugging Face
MarkTechPost

Przeczytaj więcej wiadomości na ten temat:

31 maja

Hugging Face wprowadza na rynek otwarte roboty humanoidalne AI HopeJR i Reachy Mini w 2025 roku

30 maja

Manus Slides: narzędzie AI tworzy prezentacje na podstawie jednego polecenia

30 maja

NY Tech Week 2025: wydarzenia związane ze sztuczną inteligencją i robotyką dominują w Nowym Jorku

Czy znalazłeś błąd lub niedokładność?

Rozważymy Twoje uwagi tak szybko, jak to możliwe.