热点
关于我们
xx
xx
"
开源数据集
" 相关文章
ChartGen: Scaling Chart Understanding Via Code-Guided Synthetic Chart Generation
cs.AI updates on arXiv.org
2025-07-29T04:21:45.000000Z
$\texttt{Droid}$: A Resource Suite for AI-Generated Code Detection
cs.AI updates on arXiv.org
2025-07-16T04:28:44.000000Z
社区供稿 | 智源研究院发布开源中文互联网语料库 CCI 4.0 新增高质量英文数据与合成数据
Hugging Face
2025-06-12T02:32:47.000000Z
EleutherAI releases massive AI training dataset of licensed and open domain text
TechCrunch News
2025-06-06T17:41:32.000000Z
Yandex 发布最大音乐推荐开源数据集 Yambda
IT之家
2025-05-30T06:58:15.000000Z
智源研究院发布开源中文互联网语料库CCI 4.0,新增高质量英文数据与合成数据
魔搭ModelScope社区
2025-05-22T13:56:09.000000Z
社区供稿 | 智源研究院发布开源中文互联网语料库 CCI 4.0 新增高质量英文数据与合成数据
Hugging Face
2025-05-13T16:51:52.000000Z
智源研究院发布开源中文互联网语料库CCI 4.0 新增高质量英文数据与合成数据
智源研究院
2025-05-13T16:21:16.000000Z
智源研究院发布开源中文互联网语料库CCI 4.0 新增高质量英文数据与合成数据
智源研究院
2025-05-08T07:17:11.000000Z
3710亿数学tokens,全面开放!史上最大高质量开源数学预训练数据集MegaMath发布
机器之心
2025-04-13T08:46:04.000000Z
Prime Intellect Releases SYNTHETIC-1: An Open-Source Dataset Consisting of 1.4M Curated Tasks Spanning Math, Coding, Software Engineering, STEM, and Synthetic Code Understanding
MarkTechPost@AI
2025-02-07T04:05:05.000000Z
Open Thoughts: An Open Source Initiative Advancing AI Reasoning with High-Quality Datasets and Models Like OpenThoughts-114k and OpenThinker-7B
MarkTechPost@AI
2025-01-30T19:33:21.000000Z
首个公开发表的SAR图像目标识别基础模型,国防科大刘永祥&刘丽教授团队提出SARATR-X 1.0
36氪 - 科技频道
2025-01-21T10:28:00.000000Z
我国首个通用具身智能机器人数据集发布,含两百多个不同任务的多类场景
IT之家
2025-01-03T09:37:29.000000Z
This Machine Learning Research from Amazon Introduces a New Open-Source High-Fidelity Dataset for Automotive Aerodynamics
MarkTechPost@AI
2024-12-26T07:36:38.000000Z
【深度学习】15个目标检测开源数据集汇总
机器学习初学者
2024-12-19T06:40:50.000000Z
字节开源最全代码大模型测评工具,一手教程来了!
Datawhale
2024-12-06T10:20:12.000000Z
NeurIPS 2024 数据集汇总|覆盖云层去除/化学光谱/歌声音频/自动驾驶/昆虫标本······
智源社区
2024-11-26T03:22:32.000000Z
从计算机视觉向医疗AI,上海交大谢伟迪发布多项成果,登Nature子刊/NeurIPS/CVPR等
智源社区
2024-11-20T07:37:58.000000Z
宇树宣布开源 G1 人形机器人操作数据集,适配多种方案
IT之家
2024-11-13T07:37:44.000000Z