机器之心 2024年12月30日
「源神」稚晖君又双叒叕开源,这一次机器人直接进入人类生活!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

智元公司联合上海人工智能实验室等机构开源了AgiBot World数据集,标志着具身智能领域迎来了“ImageNet”时刻。该数据集汇集了百万真实机器人数据,涵盖家居、餐饮、工业、商超和办公等五大场景,包含80多种日常技能,旨在推动通用具身智能研究。AgiBot World数据集规模庞大,质量高,为机器人研发提供了必要条件。智元还计划在2025年开源百万真机全量数据,并发布具身基座大模型,进一步推动具身智能发展。

🤖️AgiBot World是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集,数据规模和质量远超以往的同类数据集。

🦾该数据集覆盖了家居、餐饮、工业、商超和办公五大核心场景,包含80多种日常技能,从基础操作到复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。

🏠AgiBot World数据集的数据采集过程严格把控质量,从任务设计到数据审核标注,再到算法验证,每个环节都确保了数据的准确性和可用性,从而为机器人研发提供了高质量的数据支撑。

🚀智元公司还将在2025年开源百万真机全量数据,并发布具身基座大模型,以及全套工具链,进一步推动具身智能的发展,加速通用人工智能的到来。

2024-12-30 12:29 北京

具身智能领域的 ImageNet 时刻!

机器之心发布

机器之心编辑部

近期开源的 Deepseek V3,让国产 MoE 大模型在全球圈粉无数,一跃成为中国 AI 圈的顶流担当。


而作为中国具身智能的领军企业,智元也在2024年底放了个大招,携手上海人工智能实验室等单位重磅开源了AgiBot World,具身智能领域也迎来了「ImageNet」时刻!


AgiBot World(智元世界)—— 一个汇集百万真实机器人数据的开源数据集。在这个具身数据的世界里,机器人不再只是进行简单的桌面任务,而是全方位融入我们的日常生活。机器人和人类和谐相处世界的大幕,正在徐徐拉开。


2024,哪个场景最符合你对未来机器人的想象?


作你的「家务管家」,洗衣、做饭都交给它?


还是化身「打工人」在超市拣货、收银、整理货架?


亦或是工厂里的「永动机」,搬运、打包,不断电不下班?


这些「科幻片」里的场景已经在路上了!


欢迎来到 AgiBot World,一个汇集百万真实机器人数据的开源数据集。具身应用,数据先行,作为具身领域的 ImageNet,智元世界有望成为引领我们进入具身智能新时代的「通关密码」,让机器人的世界更加真实,从此告别「NPC」人生!


HuggingFace:https://huggingface.co/agibot-world

Github:https://github.com/OpenDriveLab/agibot-world


是的,你没看错,加持了 AgiBot World 的百万真机数据,机器人的控制已经如此精细。现在就能在你家客厅优雅地插花了。


整套动作行云流水,用金属制的机械手抓取,娇嫩的花材也完好无损。

 


刷马桶这事,等到机器人「出师」后也能放心交给他,再也不用全家抽签确定谁去刷了。


 

 

具身智能领域的 ImageNet 何时到来?

 

Open X-Embodiment, ICRA 2024


谷歌 DeepMind 通过整合来自 22 种不同本体机器人的数据构建了 Open X-Embodiment数据集,但大部分数据缺乏统一标准化的采集流程且许多机器人构型已经过时数据质量格式参差不齐,在机器人策略学习的过程中甚至会带来副作用。


为实现规范化的数据采集,来自斯坦福、伯克利、谷歌等构建了 DROID 数据集,尽管涵盖了相对丰富的场景与技能,然而作者团队在后续研究中指出 DROID 存在大量低质量数据,从而给机器人的学习过程造成「困惑」。


一些具身大模型初创公司基于自采集的大规模高质量双臂机器人数据训练的模型展现出了整理、分拣、洗衣等执行复杂动作的能力,这进一步印证了高质量数据在当前具身智能领域研究阶段的重要性,但相关数据集目前仅在公司内部使用,并未开源。


AgiBot World

让高质量机器人数据触手可及


为了进一步推动通用具身智能领域研究进展,让高质量机器人数据触手可及,作为上海模塑申城语料普惠计划中的一份子,智元机器人携手上海人工智能实验室、国家地方共建人形机器人创新中心以及上海库帕思,重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集开源项目 AgiBot World。


这一里程碑式的开源项目,旨在构建国际领先的开源技术底座,标志着具身智能领域 「ImageNet 时刻」已到来。


通过汇聚顶尖资源与技术力量,各方将共同推动具身智能发展新范式,加速人类迈向通用人工智能的新时代,在全球范围内奠定中国在这一前沿领域的领导地位。


AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的大规模机器人数据集。


相比于 Google 开源的 Open X-Embodiment 数据集,AgiBot World 的长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。


多样任务,十八般武艺样样精通










AgiBot World 数据集收录了八十余种日常生活中的多样化技能,从抓取、放置、推、拉等基础操作,到搅拌、折叠、熨烫等精细长程、双臂协同复杂交互,几乎涵盖了日常生活所需的绝大多数动作需求。



全域场景,上得厅堂下得厨房


AgiBot World 诞生于智元自建的大规模数据采集工厂与应用实验基地,空间总面积超过 4000 平方米,包含 3000 多种真实物品,真实复刻了家居、餐饮、工业、商超和办公五大核心场景。


全面覆盖了机器人在生产、生活中的典型应用需求,为机器人提供了一个高度真实的生产生活环境。

 


通过多场景的高度还原与任务设计,AgiBot World 为机器人研发和测试构建了实现具身智能的必要条件。



客厅、书房、餐厅、卫生间、厨房和工厂等都是机器人大显身手的舞台。


在客厅,它可以使用工具工具给地面来个全面大扫除,碎屑、灰尘和液体都「无处可逃」。


 

电视机表面容易积灰,交给机器人吧!它可以精确控制掸子掸灰,或者用软布来清理桌面的污垢,同时避免划伤表面。



厨房也可以交给机器人承包了。给它食材和配方,分分钟就能给你变出一盘精致沙拉,切菜、拌料、装盘全都会,也可以控制清洁工具对瓶内外进行刷洗。


瓶子脏了?碗要洗?躺平吧,这些都交给它们!

 


在超市,机器人可以精准控制扫码抢扫描、结算货物,还附赠装袋一条龙服务。

 


在工厂,机器人在流水线上利用机械臂精准控制将物品放入指定的包装盒中,实现物品自动打包。



AgiBot World 包含超过 100 种真实场景,按家居(40%)、餐饮(20%)、工业(20%)、商超(10%)和办公(10%)进行分布。


此外,80% 的任务为长程任务,时长集中在 60s-150s 之间,且涵盖多个原子技能,是 DROID 和 OpenX-Embodiment 工作的 5 倍。该数据集包含了 3000 多种物品,基本涵盖了这五大场景,并且仍在不断扩展和丰富中。


场景和任务分布

 

各个场景物品分类


数据集时长分布


全能硬件,没有金刚钻难揽瓷器活





质量把控,严师出高徒


AgiBot World 对数据质量要求极高,通过专业培训、多级质量把控、全程人工在环,在做到超大规模真实数据采集的前提下,严格精细化控制数据质量。




据智元透露,他们还为即将到来的 2025 年攒了一波「大招」,小小地剧透一下:


1. 百万真机全量数据将陆续开源

2. 千万仿真数据同步推送,支持更泛化和更通用的大模型训练

3. 发布具身基座大模型,支持模型微调,赋能千行百业

4. 发布全套工具链,实现采集、训练和评测完美闭环

5. 举办一系列 AgiBot World Challenge

……


那我们先一把期待住了,且看明年,智元又会带来哪些惊喜?


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com






跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

具身智能 AgiBot World 机器人数据集 智元 开源
相关文章