文 | 光锥智能,作者|刘俊宏,编辑|王一粟
“新老”机器人之间的悲欢并不相通。
当新一代机器人用人形机器人搏击、遛狗的时候,传统机器人公司还在用机械臂搬运货物。一个是人声鼎沸,一个是冷冷清清。
8月9日,又是一届世界机器人大会(WRC)在北京开幕。作为历届最大的一次展会,本次展览有200多家国内外机器人企业出席,人形机器人整机企业有50多家。本次展会上共计展出1500多件展品、100多款首发新品,多的一面墙都“简介”不完。
“大模型解决了机器人操作的问题,现在机器人能够干活,能真正与物理世界交互了。”
对于机器人这一年间的进化,智澄AI创始人、CEO胡鲁辉向光锥智能如此总结说。
冒着北京当天的大雨和水泄不通的人群,光锥智能在现场有三个最直观的感受。
首先,今年人形机器人是大会的绝对主角。之前大会的A馆一般着重展示机器人工业场景应用。今年主办方特意将宇树和加速进化两家人形机器人厂商安排进来“吸引流量”。用于演示新技术的B馆,直接被人形机器人占领。会场没有人形机器人的展台,观众密度肉眼可见的“稀疏”。
其次,今年的人形机器人演示主打“可交互”。去年机器人展会上,不少机器人周围还“拉着隔离带”,今年机器人厂商希望消费者上手“摸一摸”。在小人形机器人、机器狗、机器人小玩具的展区,光锥智能看到不少消费者询价,想要当场下单带走。
最后,今年大多数机器人厂商的演示着重展现实用价值。机器人已经实现了在工厂、科研教育、医疗养老等场景中的初步探索。
最接地气的是街头摆摊场景。大会现场随处可见各种机器人现制咖啡小摊,还有机器人小酒吧、机器人煎饼果子、机器人零售小店等变种场景。
在工业场景上,率先落地的机器人厂商已经开始强调集群协作的概念。相比去年单薄的“能干活”标签,今年的机器人开始更多强调机器人与自动化产线结合、电池续航、连续工作时长、回报周期等更落地的数据指标。
实际的落地应用,让机器人开始进入到量产阶段。当光锥智能询问量产情况时,不少机器人厂商都自豪表示今年有上百台的出货量。机器人已经开始渗透到我们的日常生活。
“今年会跟线上门店的商家合作落地100家。消费者线上下单之后,机器人负责分拣商品再交给骑手配送”。银河通用机器人合伙人傅强向光锥智能介绍称。
在大会现场,光锥智能还注意到三星的高管和几家日企的高管在现场到处“观察”。这意味着,中国的人形机器人将和其他机器人一样有出海的机遇。
机器人行业的变化,是一个明显的信号。
在一个技术创新驱动的行业,越是临近大规模应用,技术和产品的迭代速度就会越快。这是基于前期的积累,也是消费者共识驱动巴斯模型(创新扩散理论)收束的结果。
本次探展,光锥智能也联系到了银河通用、优必选、智澄AI、众擎机器人、魔法原子等多家重点公司的高管,一起全面探讨了机器人行业的当下和未来。
2025年的机器人,主打一个能干活
“去年很多机器人都动不了,今年动起来了,可以做一些具体任务。”
在今年世界机器人大会现场,傅强向光锥智能总结着一年间的变化。走过一家家公司展位,光锥智能注意到今年机器人的“花架子”演示少了,与实际商业场景结合的演示多了。
现场机器人演示场景,大概能分为四类,每一类都紧紧围绕着商业化的主题。
最吸引观众眼球的,是演示机器人的动作能力。
对比往年“小规模+定时定点”的机器人演示,今年各家厂商的机器人基本上都不带停的。动作技术高一些的玩家都在“整活”,宇树表演机器人格斗,加速进化表演机器人踢球,众擎和魔法原子搞机器人走秀。围观人群里三层外三层,根本挤不进去。还有的厂商把机器人干脆“架”到了跑步机上。
大会上也有一些运动相对能力较弱的玩家。这些机器人的展示模式跟去年差不多,都是简单展示一下外观和对话能力。更弱一点的,则是给机器人穿了身衣服。内部身体做成什么样子,这就不得而知了。
有机器人动作演示的展台,就有观众的围观。而围观本身,就能产生商业价值。“一台机器人售价在小几十万,目前客户有红旗汽车,他们做展示接待用。”在乐聚机器人展台,工作人员向光锥智能解释着机器人演示所能带来的商业价值。
而机器人现阶段落地最好的,是随处可见的零售机器人。
出现频次最多的是卖咖啡和货架场景机器人,两种机器人已经能完全实现自动化经营能力。在卖咖啡的演示中,客户扫码下单,机器人自动完成出餐。这跟在线下咖啡店购买咖啡没有任何区别。货架零售场景,机器人根据观众的选择,现场分拣拿货。
此外,现场还有做煎饼果子、自动调酒等的零售场景,这些基本可以认为是“卖咖啡”的变种,都能提供客户从扫码到出餐的全流程任务。
值得注意的是,今年零售场景的机器人开始注重实际商业落地的细节。
例如煎饼果子机器人会显示煎饼的所有状态,让消费者买得放心。另外,零售货架机器人没有盲目采用双足运动方案,这样设计主要是保证工作稳定并兼顾续航。
傅强告诉光锥智能,“轮式的好处是技术相对成熟。一台机器人搭载1.5度电的电池,就能支持连续工作8个小时。”
与零售场景相对的是,人形机器人在工业场景的应用。
相比去年的单一机器人执行固定任务的演示,今年机器人开始强调“集群协作”概念。今年大会现场上,虽然机器人工作内容还是之前的分拣、搬运、质检“三件套”,但工作流程有了相互配合的概念。
“工业场景一定要走向集群作业的,单一场景落地一两台机器人没什么意义。”
优必选副总裁、研究院院长焦继超告诉光锥智能,机器人集群协作代表人形机器人开始融入到现代工业生产体系。在这个过程中,机器人公司也能将应用中遇到的难题,转化成技术壁垒。“实现集群协作,需要机器人公司花时间深入客户生产流程,跟客户沟通,与客户工业后台管理系统进行对接。没有实际落地前,这些配合是很难想象的。” 焦继超说。
最后一类,则是行业再次上演的拼价格环节。
去年有些展商还对价格“讳莫如深”,今年都自信了许多。虽然买一个零售或工业用途的人形机器人依然成本高昂。但大多数展台的工作人员都会明确告诉我们,售价具体是几十万还是接近百万。整体来看,今年机器人的售价合理了不少。以导览和演出类型的机器人为例,7-8万的成本,跟一个人一年工资差不多。
另一边,人形机器人又开始了价格战。去年众擎就扮演着“价格屠夫”的角色,今年推出的新品选择“加量不加价”。去年3.85万能买到一款只有“下半身”的产品,今年的新品是一个完整的人形姿态。
“价格再砍一刀”的秘诀,众擎机器人联合创始人任国稳告诉光锥智能, “公司具备全栈自研能力,才能兼顾性能和售价”。
2025年,机器人真正“能干活、能挣钱”了。从今年浓厚的商业化氛围中,我们能够清晰地感受到,机器人行业在一年之间“变天了”。
一年了,大模型+机器人终于落地
为何人形机器人能在一年之间,从演示进阶到实用?
“主要是大模型能力的提升。这一代机器人技术跟上一代最大的区别,就是‘脑子进化’了。”傅强称。
这也是众多机器人厂商的共识。
其中关键的VLA模型,可以理解成是用L(语言)对之前传统的VA模型加了一层对现实世界可泛化、可预测的解释。
“VLA的泛化能力可以通过视觉输入直接输出一个模型实时生成的动作,这就是与之前编程技术最大的区别”。傅强总结说。
例如智元的GO-1大模型可以看作是添加了一层CoT(思维链),这跟Figure、星海图等主打“快慢双系统”的公司核心设计架构差不多。也有公司认为VLA之上还有世界大模型,胡鲁辉告诉光锥智能,“VLA的scaling law已遇到瓶颈,世界模型是未来”。
我们能通过星海图的家务机器人看到:屏幕左边,是人类下达的“整理床铺”指令。在屏幕右边,是语言大模型实时拆解并生成的当前命令“回到初始位置”。
核心技术路线基本一致,使得各家厂商都选择将机器人尽量都做成人形的样子,哪怕这些演示和落地场景跟人形外观“八竿子打不着”。
人形外观具有两个明确的AI训练优势。
其一是机器人训练的数据能随着硬件升级,实现最大限度的复用。“一些公司现在还做不到双足,给机器人设计人形的身体,是为了支持后续的泛化训练”,魔法原子销售总监田罡向光锥智能解释称。
另一层优势,是统一的大模型能显著降低机器人厂商的技术开发周期。在众擎展台,一位工作人员向光锥智能透露称,美的近期演示的美罗机器人下半身是基于众擎SA01研发。不到一年时间,传统制造业出身的美的,就完全掌握了人形机器人的所有运动能力。大模型大脑加上可组合的身体配件,简直是把机器人变成了“变形金刚”。
在大模型的训练下,今年机器人动作也变得更加丝滑。今年机器人虽然也有偶尔摔跤或者手没拿稳的失误,但光锥智能注意到,这些机器人的动作已经非常接近人类。以星辰智能为例,在分拣场景中,机器人手、眼、躯干的协同,简直跟人类“用筷子夹花生”一模一样。
而借助大模型的泛化能力,VLA技术领先的厂商的机器人更能理解真实世界。
以货架零售场景为例,机器人能抓的商品种类越多,代表着机器人“大脑”的泛化性更好。京东的场景全都是饮料,机器人抓取的物品类型非常单一。灵境启元的货架多了筒装薯片、瓜子和纸盒包装的商品,这些商品外包都属于比较硬的一类。银河通用的货架就复杂多了,多了充气包装的薯片、小面包、方便面、花生、饼干、辣条、啤酒,整体商品复杂度跟大型超市的零食区相当。
“我们用仿真的方法造了百亿级的训练数据。不管放什么样的东西,都可以识别出来。”
诚如傅强的解释,基于大量数据积累叠加VLA大模型训练,银河通用机器人才实现了更强的泛化理解能力。
不过,也有机器人厂商认为应该客观理解VLA技术的上限。
焦继超告诉光锥智能,训练机器人智能应该更重视真实场景的数据。“VLA可能更适合验证探索阶段。很多厂商用仿真生成数据来训练VLA,这些数据缺少真实情境的随机性。”
但无论如何,在大模型对机器人落地的催化下,今年所有机器人厂商都达成了重视软件的共识。
任国稳向光锥智能坦言道,“刚开始的时候,我们(众擎)相对更重视硬件和运动控制上。但现在我们已经投入更多精力在具身能力上。目前在研发投入上,软件算法是显著超过了硬件的。”
“关键还是技术突破,这样才能做出真正有商业化能力的机器人”。正如胡鲁辉所说,机器人行业已经走到了大规模商业化的前夜。
商业化的前夜,快到洗牌时刻?
“资本现在很冷静了,很快就迎来洗牌阶段。不能快速落地的厂商,很可能要出问题。”
谈到人形机器人的商业化竞争,焦继超向行业劈头盖脸泼了一盆冷水。
另一边,傅强认为领先商业化的机器人公司会率先建立足够高的壁垒,进而达成“赢者通吃”的局面。“肯定是恒强者恒强,后发的玩家可能会失去机会。”傅强说。
优必选和银河通用,已经将商业化看作机器人公司生死存亡的关键,而不是唯技术论。
在本次会展上,光锥智能感受到不同商业化阶段的公司之间存在比较明显的差异。
例如在工业场景,有些机器人厂商会强调机器人连续工作时长、充电还是换电、与真人员工的效益差距等指标。而另一些公司讲的还是负重、自由度、动作协同等比较基础的指标。后者的指标,或许并不是对于工业用户最关心的。
焦继超告诉光锥智能,工业场景客户的诉求都很直接,“客户上来先问能不能干活,第二个问题就是续航多少。”
对于机器人公司来说,落地应用也能带来真正意义上的产品迭代,很多硬件设计缺陷只有在工厂里面实际工作才能发现。例如优必选Walker S2的迭代,有一条是让机器人的手能直接摸到地面。这样改动,是因为上一代机器人只能在固定高度搬箱子,而不能直接从地上搬。
在零售场景,商业化进展领先的机器人公司已经“杀疯了”。
“机器人已经成标品了。一个机器人一天就能在线上门店里干活,甚至都不需要提前扫描商品。”诚如傅强所言,得益于超高的部署效率,银河通用的零售机器人正在快速攻城略地。
零售场景机器人的落地如此顺利,是因为这笔账很好算。傅强说,O2O的商业逻辑要求必须24小时接单营业,维持这样一个店铺就需要2-3个人换班,机器人可以减少管理成本。以北京为例,一个员工到手七八千,对应人员开支在1万元左右。三个人一年30万,两年60万。批量采购机器人,价格也就是在这个区间。
“最重要的是让机器人解决问题,真正提高生产力。”胡鲁辉总结说。
在大会最后,光锥智能还问了各家公司一个尖锐的问题——人形机器人大量应用,是否会影响到普通打工人的就业机会?
焦继超坦言称,“其实是解决招工难的问题。”
事实上,传统工业、服装、3C电子这些行业都需要大量的人来完成组装。但这些行业,普遍存在招工难和人员动不动就“提桶跑路”的问题。用工困难的现象,其实反映出人类并不喜欢这些枯燥且重复的工作。
为人类分忧,是机器人自诞生之初就被寄予的厚望。人形机器人的时代,已经到了。
更多精彩内容,关注钛媒体微信号(ID:taimeiti),或者下载钛媒体App