Datawhale 2024年08月14日
13万总奖金,阿里云、NVIDIA主办大模型赛事!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Datawhale赛事由阿里云、NVIDIA主办,探讨在有限资源下借助大模型为新模型训练合成优质数据。赛事提供多模态数据合成工具,设置丰厚奖项,还有通关手册及交流群。

🎯Datawhale赛事关注如何借助大模型在有限计算资源下为新模型训练高效合成优质数据。互联网数据有限且多模态数据需大量处理标注,此赛事旨在解决这一问题。

🛠️赛事提供诸多便捷的多模态数据合成工具和算子,如基于BLIP-2和Stable Diffusion模型的算子等,助力合成创新性食材并整合到方案中。

🏆本次竞赛奖金池共计130000元人民币现金奖励,设置多个奖项,包括冠军、亚军、季军、优胜奖、纪念奖、参与奖和分享奖。

📖Datawhale研发了赛事通关手册,方便大家学习参赛,同时设有交流群供找队友和技术交流。

2024-08-13 22:07 浙江

?《Datawhale赛事通关手册》

 Datawhale赛事 

主办方:阿里云、NVIDIA


当前大模型的训练数据绝大部分来源于互联网上的信息,但随着大模型尺寸与性能逐渐提升,互联网上的海量数据也将逐渐使用殆尽,并且对于多模态大模型来说,这些海量资源在获取后,也需要极大的额外处理和人力标注才可以达到可用于训练大模型的水准。因此,如何借助已有的强大的大模型,在有限的计算资源下为新的模型训练流程高效合成优质的训练数据成为了一个新兴的值得关注的问题。


阿里云、NVIDIA主办,阿里云天池平台、魔搭社区、阿里巴巴通义实验室共同组织的第四届 Data-Juicer 数据挑战赛,暨天池 Better Synth 多模态大模型数据合成挑战赛开赛啦~


01

赛事简介?

这一次我们有了新的帮手,我们除了可以自行清洗数据原材料外,还必须借助已有大模型的创造能力,合成与创造出一些新的美味食材,并探究尚处于嗷嗷待哺的多模态大模型对这些模型前辈们创新性合成出来的数据佳肴是否能很好地吸收并茁壮成长。


为了助力美味佳肴的制作与创造,Data-Juicer 再次赋能,提供诸多便捷的多模态数据合成工具和算子(如基于BLIP-2模型的图片描述文本算子,以及基于Stable Diffusion模型的文生图/文改图算子等),让您能快速上手,合成出一批创新性食材,并通过数据菜谱将它们整合到您的美味佳肴中。此外,得益于 NVIDIA 的开源大语言模型推理加速库 TensorRT-LLM 和近期发布的 NVIDIA TensorRT 10.0 提供的综合性模型优化库 TensorRT-Model-Optimizer ,线下赛选手们可以探索如何最大效率地利用大模型合成大量优质数据,以快速迭代数据合成方案。


比赛官网:
https://tianchi.aliyun.com/competition/entrance/532251


02

奖项设置?

本次竞赛奖金池共计130000元人民币现金奖励(税前),具体奖励如下:


?冠军(第1名):

50000元人民币奖金,颁发获奖证书


?亚军(第2~3名):

20000元人民币奖金,颁发获奖证书


?季军(第4~6名):

10000元人民币奖金,颁发获奖证书


优胜奖(第7~10名):

2500元人民币奖金,颁发获奖证书


纪念奖:所有进入线下赛选手都将获得由主办方提供的智能充电器或小电拼等纪念品。


参与奖:线上赛排名 11-40 名的团队每名成员,将获得阿里云茶具1套或拍拍灯1个。


分享奖:社区发帖分享解决方案并通过审核的团队,团队每名成员将获得天猫精灵方糖1台。


03

赛事分享及交流??

Datawhale针对赛事也研发了一套更为简单易上手的赛事通关手册,供大家学习参赛。同时,找队友、大赛技术交流,欢迎大家加入大赛交流群。


?加入大赛交流群?


Data-Juicer 开源代码:

https://github.com/modelscope/data-juicer

《Datawhale赛事通关手册》:

https://datawhaler.feishu.cn/wiki/PVmkwDClQiKbmOk1e7scYo2Pndd


?点击阅读原文,即可报名赛事


阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Datawhale赛事 大模型 数据合成 赛事奖励
相关文章