2025年，具身智能终于来到爆发前夜

文 | 光锥智能，作者｜刘俊宏，编辑｜王一粟

“新老”机器人之间的悲欢并不相通。

当新一代机器人用人形机器人搏击、遛狗的时候，传统机器人公司还在用机械臂搬运货物。一个是人声鼎沸，一个是冷冷清清。

8月9日，又是一届世界机器人大会（WRC）在北京开幕。作为历届最大的一次展会，本次展览有200多家国内外机器人企业出席，人形机器人整机企业有50多家。本次展会上共计展出1500多件展品、100多款首发新品，多的一面墙都“简介”不完。

“大模型解决了机器人操作的问题，现在机器人能够干活，能真正与物理世界交互了。”

对于机器人这一年间的进化，智澄AI创始人、CEO胡鲁辉向光锥智能如此总结说。

冒着北京当天的大雨和水泄不通的人群，光锥智能在现场有三个最直观的感受。

首先，今年人形机器人是大会的绝对主角。之前大会的A馆一般着重展示机器人工业场景应用。今年主办方特意将宇树和加速进化两家人形机器人厂商安排进来“吸引流量”。用于演示新技术的B馆，直接被人形机器人占领。会场没有人形机器人的展台，观众密度肉眼可见的“稀疏”。

其次，今年的人形机器人演示主打“可交互”。去年机器人展会上，不少机器人周围还“拉着隔离带”，今年机器人厂商希望消费者上手“摸一摸”。在小人形机器人、机器狗、机器人小玩具的展区，光锥智能看到不少消费者询价，想要当场下单带走。

最后，今年大多数机器人厂商的演示着重展现实用价值。机器人已经实现了在工厂、科研教育、医疗养老等场景中的初步探索。

最接地气的是街头摆摊场景。大会现场随处可见各种机器人现制咖啡小摊，还有机器人小酒吧、机器人煎饼果子、机器人零售小店等变种场景。

在工业场景上，率先落地的机器人厂商已经开始强调集群协作的概念。相比去年单薄的“能干活”标签，今年的机器人开始更多强调机器人与自动化产线结合、电池续航、连续工作时长、回报周期等更落地的数据指标。

实际的落地应用，让机器人开始进入到量产阶段。当光锥智能询问量产情况时，不少机器人厂商都自豪表示今年有上百台的出货量。机器人已经开始渗透到我们的日常生活。

“今年会跟线上门店的商家合作落地100家。消费者线上下单之后，机器人负责分拣商品再交给骑手配送”。银河通用机器人合伙人傅强向光锥智能介绍称。

在大会现场，光锥智能还注意到三星的高管和几家日企的高管在现场到处“观察”。这意味着，中国的人形机器人将和其他机器人一样有出海的机遇。

机器人行业的变化，是一个明显的信号。

在一个技术创新驱动的行业，越是临近大规模应用，技术和产品的迭代速度就会越快。这是基于前期的积累，也是消费者共识驱动巴斯模型（创新扩散理论）收束的结果。

本次探展，光锥智能也联系到了银河通用、优必选、智澄AI、众擎机器人、魔法原子等多家重点公司的高管，一起全面探讨了机器人行业的当下和未来。

2025年的机器人，主打一个能干活

“去年很多机器人都动不了，今年动起来了，可以做一些具体任务。”

在今年世界机器人大会现场，傅强向光锥智能总结着一年间的变化。走过一家家公司展位，光锥智能注意到今年机器人的“花架子”演示少了，与实际商业场景结合的演示多了。

现场机器人演示场景，大概能分为四类，每一类都紧紧围绕着商业化的主题。

最吸引观众眼球的，是演示机器人的动作能力。

对比往年“小规模+定时定点”的机器人演示，今年各家厂商的机器人基本上都不带停的。动作技术高一些的玩家都在“整活”，宇树表演机器人格斗，加速进化表演机器人踢球，众擎和魔法原子搞机器人走秀。围观人群里三层外三层，根本挤不进去。还有的厂商把机器人干脆“架”到了跑步机上。

大会上也有一些运动相对能力较弱的玩家。这些机器人的展示模式跟去年差不多，都是简单展示一下外观和对话能力。更弱一点的，则是给机器人穿了身衣服。内部身体做成什么样子，这就不得而知了。

有机器人动作演示的展台，就有观众的围观。而围观本身，就能产生商业价值。“一台机器人售价在小几十万，目前客户有红旗汽车，他们做展示接待用。”在乐聚机器人展台，工作人员向光锥智能解释着机器人演示所能带来的商业价值。

而机器人现阶段落地最好的，是随处可见的零售机器人。

出现频次最多的是卖咖啡和货架场景机器人，两种机器人已经能完全实现自动化经营能力。在卖咖啡的演示中，客户扫码下单，机器人自动完成出餐。这跟在线下咖啡店购买咖啡没有任何区别。货架零售场景，机器人根据观众的选择，现场分拣拿货。

此外，现场还有做煎饼果子、自动调酒等的零售场景，这些基本可以认为是“卖咖啡”的变种，都能提供客户从扫码到出餐的全流程任务。

值得注意的是，今年零售场景的机器人开始注重实际商业落地的细节。

例如煎饼果子机器人会显示煎饼的所有状态，让消费者买得放心。另外，零售货架机器人没有盲目采用双足运动方案，这样设计主要是保证工作稳定并兼顾续航。

傅强告诉光锥智能，“轮式的好处是技术相对成熟。一台机器人搭载1.5度电的电池，就能支持连续工作8个小时。”

与零售场景相对的是，人形机器人在工业场景的应用。

相比去年的单一机器人执行固定任务的演示，今年机器人开始强调“集群协作”概念。今年大会现场上，虽然机器人工作内容还是之前的分拣、搬运、质检“三件套”，但工作流程有了相互配合的概念。

“工业场景一定要走向集群作业的，单一场景落地一两台机器人没什么意义。”

优必选副总裁、研究院院长焦继超告诉光锥智能，机器人集群协作代表人形机器人开始融入到现代工业生产体系。在这个过程中，机器人公司也能将应用中遇到的难题，转化成技术壁垒。“实现集群协作，需要机器人公司花时间深入客户生产流程，跟客户沟通，与客户工业后台管理系统进行对接。没有实际落地前，这些配合是很难想象的。” 焦继超说。

最后一类，则是行业再次上演的拼价格环节。

去年有些展商还对价格“讳莫如深”，今年都自信了许多。虽然买一个零售或工业用途的人形机器人依然成本高昂。但大多数展台的工作人员都会明确告诉我们，售价具体是几十万还是接近百万。整体来看，今年机器人的售价合理了不少。以导览和演出类型的机器人为例，7-8万的成本，跟一个人一年工资差不多。

另一边，人形机器人又开始了价格战。去年众擎就扮演着“价格屠夫”的角色，今年推出的新品选择“加量不加价”。去年3.85万能买到一款只有“下半身”的产品，今年的新品是一个完整的人形姿态。

“价格再砍一刀”的秘诀，众擎机器人联合创始人任国稳告诉光锥智能， “公司具备全栈自研能力，才能兼顾性能和售价”。

2025年，机器人真正“能干活、能挣钱”了。从今年浓厚的商业化氛围中，我们能够清晰地感受到，机器人行业在一年之间“变天了”。

一年了，大模型+机器人终于落地

为何人形机器人能在一年之间，从演示进阶到实用？

“主要是大模型能力的提升。这一代机器人技术跟上一代最大的区别，就是‘脑子进化’了。”傅强称。

这也是众多机器人厂商的共识。

其中关键的VLA模型，可以理解成是用L（语言）对之前传统的VA模型加了一层对现实世界可泛化、可预测的解释。

“VLA的泛化能力可以通过视觉输入直接输出一个模型实时生成的动作，这就是与之前编程技术最大的区别”。傅强总结说。

例如智元的GO-1大模型可以看作是添加了一层CoT（思维链），这跟Figure、星海图等主打“快慢双系统”的公司核心设计架构差不多。也有公司认为VLA之上还有世界大模型，胡鲁辉告诉光锥智能，“VLA的scaling law已遇到瓶颈，世界模型是未来”。

我们能通过星海图的家务机器人看到：屏幕左边，是人类下达的“整理床铺”指令。在屏幕右边，是语言大模型实时拆解并生成的当前命令“回到初始位置”。

核心技术路线基本一致，使得各家厂商都选择将机器人尽量都做成人形的样子，哪怕这些演示和落地场景跟人形外观“八竿子打不着”。

人形外观具有两个明确的AI训练优势。

其一是机器人训练的数据能随着硬件升级，实现最大限度的复用。“一些公司现在还做不到双足，给机器人设计人形的身体，是为了支持后续的泛化训练”，魔法原子销售总监田罡向光锥智能解释称。

另一层优势，是统一的大模型能显著降低机器人厂商的技术开发周期。在众擎展台，一位工作人员向光锥智能透露称，美的近期演示的美罗机器人下半身是基于众擎SA01研发。不到一年时间，传统制造业出身的美的，就完全掌握了人形机器人的所有运动能力。大模型大脑加上可组合的身体配件，简直是把机器人变成了“变形金刚”。

在大模型的训练下，今年机器人动作也变得更加丝滑。今年机器人虽然也有偶尔摔跤或者手没拿稳的失误，但光锥智能注意到，这些机器人的动作已经非常接近人类。以星辰智能为例，在分拣场景中，机器人手、眼、躯干的协同，简直跟人类“用筷子夹花生”一模一样。

而借助大模型的泛化能力，VLA技术领先的厂商的机器人更能理解真实世界。

以货架零售场景为例，机器人能抓的商品种类越多，代表着机器人“大脑”的泛化性更好。京东的场景全都是饮料，机器人抓取的物品类型非常单一。灵境启元的货架多了筒装薯片、瓜子和纸盒包装的商品，这些商品外包都属于比较硬的一类。银河通用的货架就复杂多了，多了充气包装的薯片、小面包、方便面、花生、饼干、辣条、啤酒，整体商品复杂度跟大型超市的零食区相当。

“我们用仿真的方法造了百亿级的训练数据。不管放什么样的东西，都可以识别出来。”

诚如傅强的解释，基于大量数据积累叠加VLA大模型训练，银河通用机器人才实现了更强的泛化理解能力。

不过，也有机器人厂商认为应该客观理解VLA技术的上限。

焦继超告诉光锥智能，训练机器人智能应该更重视真实场景的数据。“VLA可能更适合验证探索阶段。很多厂商用仿真生成数据来训练VLA，这些数据缺少真实情境的随机性。”

但无论如何，在大模型对机器人落地的催化下，今年所有机器人厂商都达成了重视软件的共识。

任国稳向光锥智能坦言道，“刚开始的时候，我们（众擎）相对更重视硬件和运动控制上。但现在我们已经投入更多精力在具身能力上。目前在研发投入上，软件算法是显著超过了硬件的。”

“关键还是技术突破，这样才能做出真正有商业化能力的机器人”。正如胡鲁辉所说，机器人行业已经走到了大规模商业化的前夜。

商业化的前夜，快到洗牌时刻？

“资本现在很冷静了，很快就迎来洗牌阶段。不能快速落地的厂商，很可能要出问题。”

谈到人形机器人的商业化竞争，焦继超向行业劈头盖脸泼了一盆冷水。

另一边，傅强认为领先商业化的机器人公司会率先建立足够高的壁垒，进而达成“赢者通吃”的局面。“肯定是恒强者恒强，后发的玩家可能会失去机会。”傅强说。

优必选和银河通用，已经将商业化看作机器人公司生死存亡的关键，而不是唯技术论。

在本次会展上，光锥智能感受到不同商业化阶段的公司之间存在比较明显的差异。

例如在工业场景，有些机器人厂商会强调机器人连续工作时长、充电还是换电、与真人员工的效益差距等指标。而另一些公司讲的还是负重、自由度、动作协同等比较基础的指标。后者的指标，或许并不是对于工业用户最关心的。

焦继超告诉光锥智能，工业场景客户的诉求都很直接，“客户上来先问能不能干活，第二个问题就是续航多少。”

对于机器人公司来说，落地应用也能带来真正意义上的产品迭代，很多硬件设计缺陷只有在工厂里面实际工作才能发现。例如优必选Walker S2的迭代，有一条是让机器人的手能直接摸到地面。这样改动，是因为上一代机器人只能在固定高度搬箱子，而不能直接从地上搬。

在零售场景，商业化进展领先的机器人公司已经“杀疯了”。

“机器人已经成标品了。一个机器人一天就能在线上门店里干活，甚至都不需要提前扫描商品。”诚如傅强所言，得益于超高的部署效率，银河通用的零售机器人正在快速攻城略地。

零售场景机器人的落地如此顺利，是因为这笔账很好算。傅强说，O2O的商业逻辑要求必须24小时接单营业，维持这样一个店铺就需要2-3个人换班，机器人可以减少管理成本。以北京为例，一个员工到手七八千，对应人员开支在1万元左右。三个人一年30万，两年60万。批量采购机器人，价格也就是在这个区间。

“最重要的是让机器人解决问题，真正提高生产力。”胡鲁辉总结说。

在大会最后，光锥智能还问了各家公司一个尖锐的问题——人形机器人大量应用，是否会影响到普通打工人的就业机会？

焦继超坦言称，“其实是解决招工难的问题。”

事实上，传统工业、服装、3C电子这些行业都需要大量的人来完成组装。但这些行业，普遍存在招工难和人员动不动就“提桶跑路”的问题。用工困难的现象，其实反映出人类并不喜欢这些枯燥且重复的工作。

为人类分忧，是机器人自诞生之初就被寄予的厚望。人形机器人的时代，已经到了。

更多精彩内容，关注钛媒体微信号（ID：taimeiti），或者下载钛媒体App

2025年的机器人，主打一个能干活

一年了，大模型+机器人终于落地

商业化的前夜，快到洗牌时刻？

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签