钛媒体:引领未来商业与生活新知 5小时前
2025年,具身智能终于来到爆发前夜
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本届世界机器人大会展示了人形机器人一年来的巨大进步,大模型技术的赋能是关键驱动力。人形机器人从演示走向实用,在格斗、踢球、零售、工业协作等场景展现出更强的交互性和实用价值。目前,机器人已开始在零售场景实现自动化经营,并在工业场景强调集群协作。价格方面,部分机器人已趋于合理化。大模型技术,特别是VLA模型,显著提升了机器人的泛化能力和动作协调性,使得机器人能够更灵活地处理复杂任务。未来,机器人行业将加速洗牌,商业化落地能力成为关键竞争要素。同时,人形机器人的发展也有望解决部分行业的招工难问题,并将人类从重复性工作中解放出来。

🤖 **大模型赋能人形机器人,实现技术飞跃:** 本届世界机器人大会上,大模型技术的进步,特别是VLA模型,被认为是推动人形机器人从演示走向实用的关键。大模型赋予了机器人更强的“脑力”,使其能够理解并执行更复杂的任务,实现与物理世界的深度交互,显著提升了机器人的泛化能力和动作协调性,使之能够更好地理解真实世界,完成如“整理床铺”等指令。

🛍️ **零售场景率先落地,商业化前景广阔:** 人形机器人已在零售场景中实现初步的商业化落地,例如机器人现制咖啡、货架零售等。这些机器人能够完成从扫码下单到自动出餐的全流程任务,并且注重实际商业落地的细节,如煎饼果子机器人展示制作过程,货架机器人能识别并分拣多种复杂包装的商品。这种高部署效率和成本效益(可替代2-3名人工)使其成为商业化的有力选择。

🏭 **工业场景迈向集群协作,提升生产效率:** 在工业应用方面,人形机器人不再局限于单一任务的执行,而是开始强调“集群协作”的概念。机器人能够在工厂、科研教育、医疗养老等场景中实现初步探索,并开始与自动化产线结合,强调集群作业以提升整体生产效率。这标志着人形机器人正逐步融入现代工业生产体系,通过实际落地解决生产流程中的难题。

💰 **价格趋于合理化,市场竞争加剧:** 尽管人形机器人的成本依然较高,但相较于去年,部分机器人的售价已趋于合理。例如,导览和演出类型的机器人价格已接近一个人一年的工资。同时,机器人行业的价格竞争也在加剧,部分厂商通过全栈自研能力实现了“加量不加价”,这预示着机器人行业正加速洗牌,具备快速落地能力的厂商将占据优势。

🤝 **解决用工难题,人机协作成为趋势:** 人形机器人的广泛应用有望缓解部分行业普遍存在的招工难和人员流失问题,特别是在传统工业、服装、3C电子等需要大量人工的领域。机器人能够承担枯燥重复的工作,从而将人类从繁重的劳动中解放出来,实现人机协作,共同提升生产力。这符合机器人自诞生之初就被寄予的“为人类分忧”的厚望。

文 | 光锥智能,作者|刘俊宏,编辑|王一粟

“新老”机器人之间的悲欢并不相通。

当新一代机器人用人形机器人搏击、遛狗的时候,传统机器人公司还在用机械臂搬运货物。一个是人声鼎沸,一个是冷冷清清。

8月9日,又是一届世界机器人大会(WRC)在北京开幕。作为历届最大的一次展会,本次展览有200多家国内外机器人企业出席,人形机器人整机企业有50多家。本次展会上共计展出1500多件展品、100多款首发新品,多的一面墙都“简介”不完。

“大模型解决了机器人操作的问题,现在机器人能够干活,能真正与物理世界交互了。”

对于机器人这一年间的进化,智澄AI创始人、CEO胡鲁辉向光锥智能如此总结说。

冒着北京当天的大雨和水泄不通的人群,光锥智能在现场有三个最直观的感受。

首先,今年人形机器人是大会的绝对主角。之前大会的A馆一般着重展示机器人工业场景应用。今年主办方特意将宇树和加速进化两家人形机器人厂商安排进来“吸引流量”。用于演示新技术的B馆,直接被人形机器人占领。会场没有人形机器人的展台,观众密度肉眼可见的“稀疏”。

其次,今年的人形机器人演示主打“可交互”。去年机器人展会上,不少机器人周围还“拉着隔离带”,今年机器人厂商希望消费者上手“摸一摸”。在小人形机器人、机器狗、机器人小玩具的展区,光锥智能看到不少消费者询价,想要当场下单带走。

最后,今年大多数机器人厂商的演示着重展现实用价值。机器人已经实现了在工厂、科研教育、医疗养老等场景中的初步探索。

最接地气的是街头摆摊场景。大会现场随处可见各种机器人现制咖啡小摊,还有机器人小酒吧、机器人煎饼果子、机器人零售小店等变种场景。

在工业场景上,率先落地的机器人厂商已经开始强调集群协作的概念。相比去年单薄的“能干活”标签,今年的机器人开始更多强调机器人与自动化产线结合、电池续航、连续工作时长、回报周期等更落地的数据指标。

实际的落地应用,让机器人开始进入到量产阶段。当光锥智能询问量产情况时,不少机器人厂商都自豪表示今年有上百台的出货量。机器人已经开始渗透到我们的日常生活。

“今年会跟线上门店的商家合作落地100家。消费者线上下单之后,机器人负责分拣商品再交给骑手配送”。银河通用机器人合伙人傅强向光锥智能介绍称。

在大会现场,光锥智能还注意到三星的高管和几家日企的高管在现场到处“观察”。这意味着,中国的人形机器人将和其他机器人一样有出海的机遇。

机器人行业的变化,是一个明显的信号。

在一个技术创新驱动的行业,越是临近大规模应用,技术和产品的迭代速度就会越快。这是基于前期的积累,也是消费者共识驱动巴斯模型(创新扩散理论)收束的结果。

本次探展,光锥智能也联系到了银河通用、优必选、智澄AI、众擎机器人、魔法原子等多家重点公司的高管,一起全面探讨了机器人行业的当下和未来。

2025年的机器人,主打一个能干活

“去年很多机器人都动不了,今年动起来了,可以做一些具体任务。”

在今年世界机器人大会现场,傅强向光锥智能总结着一年间的变化。走过一家家公司展位,光锥智能注意到今年机器人的“花架子”演示少了,与实际商业场景结合的演示多了。

现场机器人演示场景,大概能分为四类,每一类都紧紧围绕着商业化的主题。

最吸引观众眼球的,是演示机器人的动作能力。

对比往年“小规模+定时定点”的机器人演示,今年各家厂商的机器人基本上都不带停的。动作技术高一些的玩家都在“整活”,宇树表演机器人格斗,加速进化表演机器人踢球,众擎和魔法原子搞机器人走秀。围观人群里三层外三层,根本挤不进去。还有的厂商把机器人干脆“架”到了跑步机上。 

大会上也有一些运动相对能力较弱的玩家。这些机器人的展示模式跟去年差不多,都是简单展示一下外观和对话能力。更弱一点的,则是给机器人穿了身衣服。内部身体做成什么样子,这就不得而知了。

有机器人动作演示的展台,就有观众的围观。而围观本身,就能产生商业价值。“一台机器人售价在小几十万,目前客户有红旗汽车,他们做展示接待用。”在乐聚机器人展台,工作人员向光锥智能解释着机器人演示所能带来的商业价值。

而机器人现阶段落地最好的,是随处可见的零售机器人。

出现频次最多的是卖咖啡和货架场景机器人,两种机器人已经能完全实现自动化经营能力。在卖咖啡的演示中,客户扫码下单,机器人自动完成出餐。这跟在线下咖啡店购买咖啡没有任何区别。货架零售场景,机器人根据观众的选择,现场分拣拿货。

此外,现场还有做煎饼果子、自动调酒等的零售场景,这些基本可以认为是“卖咖啡”的变种,都能提供客户从扫码到出餐的全流程任务。

值得注意的是,今年零售场景的机器人开始注重实际商业落地的细节。

例如煎饼果子机器人会显示煎饼的所有状态,让消费者买得放心。另外,零售货架机器人没有盲目采用双足运动方案,这样设计主要是保证工作稳定并兼顾续航。

傅强告诉光锥智能,“轮式的好处是技术相对成熟。一台机器人搭载1.5度电的电池,就能支持连续工作8个小时。”

与零售场景相对的是,人形机器人在工业场景的应用。

相比去年的单一机器人执行固定任务的演示,今年机器人开始强调“集群协作”概念。今年大会现场上,虽然机器人工作内容还是之前的分拣、搬运、质检“三件套”,但工作流程有了相互配合的概念。

“工业场景一定要走向集群作业的,单一场景落地一两台机器人没什么意义。”

优必选副总裁、研究院院长焦继超告诉光锥智能,机器人集群协作代表人形机器人开始融入到现代工业生产体系。在这个过程中,机器人公司也能将应用中遇到的难题,转化成技术壁垒。“实现集群协作,需要机器人公司花时间深入客户生产流程,跟客户沟通,与客户工业后台管理系统进行对接。没有实际落地前,这些配合是很难想象的。” 焦继超说。

最后一类,则是行业再次上演的拼价格环节。

去年有些展商还对价格“讳莫如深”,今年都自信了许多。虽然买一个零售或工业用途的人形机器人依然成本高昂。但大多数展台的工作人员都会明确告诉我们,售价具体是几十万还是接近百万。整体来看,今年机器人的售价合理了不少。以导览和演出类型的机器人为例,7-8万的成本,跟一个人一年工资差不多。

另一边,人形机器人又开始了价格战。去年众擎就扮演着“价格屠夫”的角色,今年推出的新品选择“加量不加价”。去年3.85万能买到一款只有“下半身”的产品,今年的新品是一个完整的人形姿态。

“价格再砍一刀”的秘诀,众擎机器人联合创始人任国稳告诉光锥智能, “公司具备全栈自研能力,才能兼顾性能和售价”。

2025年,机器人真正“能干活、能挣钱”了。从今年浓厚的商业化氛围中,我们能够清晰地感受到,机器人行业在一年之间“变天了”。

一年了,大模型+机器人终于落地

为何人形机器人能在一年之间,从演示进阶到实用?

“主要是大模型能力的提升。这一代机器人技术跟上一代最大的区别,就是‘脑子进化’了。”傅强称。

这也是众多机器人厂商的共识。

其中关键的VLA模型,可以理解成是用L(语言)对之前传统的VA模型加了一层对现实世界可泛化、可预测的解释。

“VLA的泛化能力可以通过视觉输入直接输出一个模型实时生成的动作,这就是与之前编程技术最大的区别”。傅强总结说。

例如智元的GO-1大模型可以看作是添加了一层CoT(思维链),这跟Figure、星海图等主打“快慢双系统”的公司核心设计架构差不多。也有公司认为VLA之上还有世界大模型,胡鲁辉告诉光锥智能,“VLA的scaling law已遇到瓶颈,世界模型是未来”。

我们能通过星海图的家务机器人看到:屏幕左边,是人类下达的“整理床铺”指令。在屏幕右边,是语言大模型实时拆解并生成的当前命令“回到初始位置”。

核心技术路线基本一致,使得各家厂商都选择将机器人尽量都做成人形的样子,哪怕这些演示和落地场景跟人形外观“八竿子打不着”。

人形外观具有两个明确的AI训练优势。

其一是机器人训练的数据能随着硬件升级,实现最大限度的复用。“一些公司现在还做不到双足,给机器人设计人形的身体,是为了支持后续的泛化训练”,魔法原子销售总监田罡向光锥智能解释称。

另一层优势,是统一的大模型能显著降低机器人厂商的技术开发周期。在众擎展台,一位工作人员向光锥智能透露称,美的近期演示的美罗机器人下半身是基于众擎SA01研发。不到一年时间,传统制造业出身的美的,就完全掌握了人形机器人的所有运动能力。大模型大脑加上可组合的身体配件,简直是把机器人变成了“变形金刚”。

在大模型的训练下,今年机器人动作也变得更加丝滑。今年机器人虽然也有偶尔摔跤或者手没拿稳的失误,但光锥智能注意到,这些机器人的动作已经非常接近人类。以星辰智能为例,在分拣场景中,机器人手、眼、躯干的协同,简直跟人类“用筷子夹花生”一模一样。

而借助大模型的泛化能力,VLA技术领先的厂商的机器人更能理解真实世界。

以货架零售场景为例,机器人能抓的商品种类越多,代表着机器人“大脑”的泛化性更好。京东的场景全都是饮料,机器人抓取的物品类型非常单一。灵境启元的货架多了筒装薯片、瓜子和纸盒包装的商品,这些商品外包都属于比较硬的一类。银河通用的货架就复杂多了,多了充气包装的薯片、小面包、方便面、花生、饼干、辣条、啤酒,整体商品复杂度跟大型超市的零食区相当。

“我们用仿真的方法造了百亿级的训练数据。不管放什么样的东西,都可以识别出来。”

诚如傅强的解释,基于大量数据积累叠加VLA大模型训练,银河通用机器人才实现了更强的泛化理解能力。

不过,也有机器人厂商认为应该客观理解VLA技术的上限。

焦继超告诉光锥智能,训练机器人智能应该更重视真实场景的数据。“VLA可能更适合验证探索阶段。很多厂商用仿真生成数据来训练VLA,这些数据缺少真实情境的随机性。”

但无论如何,在大模型对机器人落地的催化下,今年所有机器人厂商都达成了重视软件的共识。

任国稳向光锥智能坦言道,“刚开始的时候,我们(众擎)相对更重视硬件和运动控制上。但现在我们已经投入更多精力在具身能力上。目前在研发投入上,软件算法是显著超过了硬件的。”

“关键还是技术突破,这样才能做出真正有商业化能力的机器人”。正如胡鲁辉所说,机器人行业已经走到了大规模商业化的前夜。

商业化的前夜,快到洗牌时刻?

“资本现在很冷静了,很快就迎来洗牌阶段。不能快速落地的厂商,很可能要出问题。”

谈到人形机器人的商业化竞争,焦继超向行业劈头盖脸泼了一盆冷水。

另一边,傅强认为领先商业化的机器人公司会率先建立足够高的壁垒,进而达成“赢者通吃”的局面。“肯定是恒强者恒强,后发的玩家可能会失去机会。”傅强说。

优必选和银河通用,已经将商业化看作机器人公司生死存亡的关键,而不是唯技术论。

在本次会展上,光锥智能感受到不同商业化阶段的公司之间存在比较明显的差异。

例如在工业场景,有些机器人厂商会强调机器人连续工作时长、充电还是换电、与真人员工的效益差距等指标。而另一些公司讲的还是负重、自由度、动作协同等比较基础的指标。后者的指标,或许并不是对于工业用户最关心的。

焦继超告诉光锥智能,工业场景客户的诉求都很直接,“客户上来先问能不能干活,第二个问题就是续航多少。”

对于机器人公司来说,落地应用也能带来真正意义上的产品迭代,很多硬件设计缺陷只有在工厂里面实际工作才能发现。例如优必选Walker S2的迭代,有一条是让机器人的手能直接摸到地面。这样改动,是因为上一代机器人只能在固定高度搬箱子,而不能直接从地上搬。

在零售场景,商业化进展领先的机器人公司已经“杀疯了”。

“机器人已经成标品了。一个机器人一天就能在线上门店里干活,甚至都不需要提前扫描商品。”诚如傅强所言,得益于超高的部署效率,银河通用的零售机器人正在快速攻城略地。

零售场景机器人的落地如此顺利,是因为这笔账很好算。傅强说,O2O的商业逻辑要求必须24小时接单营业,维持这样一个店铺就需要2-3个人换班,机器人可以减少管理成本。以北京为例,一个员工到手七八千,对应人员开支在1万元左右。三个人一年30万,两年60万。批量采购机器人,价格也就是在这个区间。

“最重要的是让机器人解决问题,真正提高生产力。”胡鲁辉总结说。

在大会最后,光锥智能还问了各家公司一个尖锐的问题——人形机器人大量应用,是否会影响到普通打工人的就业机会?

焦继超坦言称,“其实是解决招工难的问题。” 

事实上,传统工业、服装、3C电子这些行业都需要大量的人来完成组装。但这些行业,普遍存在招工难和人员动不动就“提桶跑路”的问题。用工困难的现象,其实反映出人类并不喜欢这些枯燥且重复的工作。

为人类分忧,是机器人自诞生之初就被寄予的厚望。人形机器人的时代,已经到了。

更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

人形机器人 大模型 机器人技术 商业化落地 人工智能
相关文章