IT之家 05月30日 14:58
Yandex 发布最大音乐推荐开源数据集 Yambda
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

俄罗斯搜索引擎 Yandex 发布了名为 Yambda 的大型音乐推荐系统开源数据集,其中包含近 48 亿条匿名用户交互数据。该数据集源于 Yandex Music 平台,收集了近 2800 万月度用户在十个月内的行为数据,涵盖用户与 939 万首歌曲的交互反馈。Yambda 数据集以三种不同规模(5B、500M、50M)提供,方便开发者根据需求下载使用。数据集主要用于研究和开发 AI 音乐推荐功能,为开发者提供了宝贵的资源,推动音乐推荐技术的发展。

🎧 Yambda 数据集由 Yandex 收集,包含了近 2800 万 Yandex Music 月度用户的交互数据,时间跨度为十个月。

🎵 数据集中记录了用户与 939 万首歌曲的 47.9 亿次交互,包括听众对歌曲的喜好反馈,所有交互均带有时间戳。

💾 Yambda 数据集提供三种不同规模的版本:Yambda-5B(100 万用户行为)、Yambda-500M(10 万用户)和 Yambda-50M(1 万用户)。

💡 数据集以 Apache Parquet 格式存储,可用于研究或开发 AI 音乐推荐功能,类似于 Spotify 等流媒体服务。

🔒 Spotify 和 Tidal 等流媒体服务通常不会公开其音乐推荐算法的代码或模型,将其视为商业机密。

IT之家 5 月 30 日消息,俄罗斯搜索引擎巨头 Yandex 昨日发布了世界上最大的音乐推荐系统开源数据集 Yambda,包含 47.9 亿条匿名用户的交互数据,旨在帮助开发者创建智能音乐服务。

Yandex 在十个月内收集了近 2800 万 Yandex Music 月度用户的数据,具体为用户与 939 万首歌曲的 47.9 亿次交互,数据集包括听众对歌曲好恶的关键反馈,所有交互都带有时间戳以提高准确度。

Yambda 在 Hugging Face 提供三种大小的数据集供自由下载:Yambda-5B(来自 100 万名用户的行为)、Yambda-500M(10 万用户)和 Yambda-50M(1 万用户)。其中规模最大的 5B 数据集至少需要 85 GB 存储空间

数据集包含音乐听众的偏好信息,以 Apache Parquet 格式存储,可用作研究用途或开发类似 Spotify 等流媒体服务提供的 AI 音乐推荐功能。

据IT之家了解,Spotify 和 Tidal 等流媒体服务通常不会发布其音乐推荐算法的代码或模型,因为推荐听众喜爱歌曲的能力被视为其成功的商业秘密。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Yandex 音乐推荐 开源数据集 AI 音乐
相关文章