Key Points
● 如果智元是机器人的大脑派,宇树科技就是身体派;
● 宇树科技专注做硬件本体,AI软件的布局相对克制,因为「太烧钱了」;
● AGI一定是具身的智能,大语言模型有幻觉,就是因为没有身体反馈信号;
● 今年年底之前,全球至少会有一家公司或者实验室能把通用型的机器人AI模型做出来。
虽然最终产品长得都差不多,机器人——尤其是人形机器人领域正越来越分化为两大阵营:以上海的「智元」机器人和北京的银河通用为代表的机器人公司,被认为主要企图是开发机器人的「大脑」;以杭州宇树科技为代表的机器人公司,则被认为胜在机器人本体(也就是机器人的身体)。
作为宇树科技的创始人、CEO和CTO,王兴兴并不反感业界对其公司「硬件很厉害」的看法。他同意AI很重要,「这一轮机器人浪潮主要就是生成式AI浪潮带来的」。他在今年8月世界机器人大会期间接受媒体群访时说,而且,机器人行业现阶段最大的限制仍然是AI不够而非硬件不够——后者仅仅是个工程问题,一旦有人将适配于机器人的AI模型开发出来,为之定制10万个机器人硬件是几个月就能完成的事。
不过,对于机器人公司是否应该大举投入AI研发,王兴兴的态度是保守的,「AI太烧钱了」他说。而且,和部分人所持的「机器人大脑更重要,身体没那么重要」的观点不同,王兴兴认为AGI的实现离不开身体。他举了一个与做梦有关的例子。做梦时人会突然感觉从悬崖往下掉,或者在梦里怎么都跑不快,他本人对这个问题的答案是「睡觉时人的大脑跟身体感知是完全断开的」。清醒状态下,人每跑一步都能与地面实际接触,并得到地面的反馈,让大脑知道一只脚接触到了地面,这时候它很清楚何时迈出另一只脚,从而控制跑步速度。但在梦境中,大脑与身体断联,它永远也不知道身体是否已经踩到地面。王兴兴认为,用「身体提供反馈信号」这一理论很容易解释为什么大语言模型会有幻觉,原因很简单,它没有与物理世界的连接,跟人类做梦差不多。
王兴兴坚信,AGI的实现除了纯粹的AI还需要身体,即更高级的智能必须是「具身」的,这个模型要能实时采集数据,通过身体与现实世界的接触或「碰撞」,理解重力、摩擦力、光学等物理概念,建立真正的世界模型。身体结构限制智能水平的状况在自然界有很多。「能说话的鹦鹉只有20万至30万的神经元,猴子、猩猩的神经元比它更多,但是为什么猩猩说不了话?」王兴兴说,他对这个问题的理解是,鹦鹉之所以能说话是因为它很喜欢吃坚果,这个过程中喉咙和舌头都被训练得非常灵活,而猩猩没有这样的身体条件。
在王兴兴看来,创造更好的身体方案是做好机器人产品的重要课题。机器人的身体不是标准化的,不是一定要有五根手指或者三根手指——残疾人在失去手掌、只剩小臂后,依然能做非常精细的事。重要的是背后有强大的大脑可以与身体实现具身的匹配(注:人的大脑具有很强的可塑性,可以与千差万别的身体结合起来发挥功能,而这种强大大脑的形成离不开身体的参与)。
相较于其他机器人公司,王兴兴更强调身体对于提升大脑能力、实现AGI的重要性。不过他并没有对如何基于身体实现具身智能给出明确路径。目前,宇树科技已发布3款「机器狗」,它们有着4条腿,连接4条腿的是一个扮演大脑角色的中央控制器;还有两款人形机器人,一款成人大小,另一款看起来像个儿童,售价9.9万元。这些人形机器人的手部采用的是三指方案而不是两指或五指。王兴兴称,宇树科技正在尝试将更多触觉传感器加载到这些机器人的身体上,使它们更能「理解」抓取物体时物体会不会滑落,或者会不会把物体抓坏。
AI方面,宇树科技做的工作主要是通过强化学习训练机器人掌握一些运动控制能力,尤其是在复杂地形上的适应能力和运动能力。王兴兴称,今年年初,宇树科技实现了全球第一款纯电力驱动的人形机器人空翻。传统算法很难实现机器人的空翻,宇树的这款机器人采用了模仿学习加强化学习算法。
不过这些AI能力距离王兴兴希望达到的目标还有很远。比如机器人能做的每个动作都需要单独做训练,它们也不能自动切换所有动作,需要人为去切换。而且,它们还不能操作相对精细化的零件,比如焊接电路、穿针引线。
王兴兴称,宇树科技并没有在AI上激进投入,相较于自己做出机器人所需要的基础模型,他更相信全球所有同行的共同努力。不过,他认为这一时间点不会太晚,「今年年底之前,全球至少会有一家公司或实验室把通用型的机器人AI模型做出来」。
本文是机器人系列的第二篇,第一篇请移步:机器人系列|①智元:想让所有机器人都接入智元的大脑
以下是我们根据媒体群访整理的速记,内容有删减:
从四足到双足,底层算法可通用
Q:近期人形机器人火热,但早期业界普遍不看好人形机器人,宇树在人形机器人上的发展战略是怎样的?
王兴兴:基本上还是追寻整个社会共识。2020年以前,很多投资人问我做不做人形机器人,我非常斩钉截铁地说我们不做。早在2009年大一寒假,我就自己做过小的仿生人形机器人,做好以后远没有达到预期,当时全球的人形机器人控制技术不是特别理想,看不到实用价值。
2021年到2022年的时候,在马斯克的带领下,全球技术领域对人形机器人非常关注。2022年年底,大语言模型出来以后,AI技术发生了质变,大家看到AI赋能机器人带来的潜力。2022年年底,我们还没做人形机器人,已经有一些客户找上我们想买人形机器人。所以我们觉得社会共识、热度、客户的期待程度已经足够了,2023年我们正式开始做人形机器人。
Q:宇树是做四足机器人起家的,人形机器人是四足机器人站起来吗?
王兴兴:为什么早年大家做四足机器人比较多,做人形机器人比较少,是因为和人形机器人比起来,如果用同样的电机,四足机器人可以背更多货,至少两倍,负载能力更强,续航能力更强,稳定性更好,技术成熟度也会更高。
从技术或者进化的角度看,人是灵长类动物,从四条腿的动物进化过来,机器人也是一样。过去一两年,国内很多人形机器人公司都出来了,它们用了大量的开源四足机器人技术,包括整个控制算法、硬件。全球很多知名学术机构都用我们的机器狗开发了开源算法,大家可以去网上下载一些四足机器人的算法,移植到人形机器人上都可以用。
Q:目前宇树四足机器人进入了哪些市场?人形机器人的快速发展对四足机器人来说是机遇还是挑战?
王兴兴:四足机器人我们在消费端、科研教育端还有行业端都有做。去年我们的产品单价更低了,今年整个消费端的增长速度挺快,目前消费端可能占了整个机器狗营收的1/3左右。从出货量角度说,消费端的机器狗数量最多,它比较便宜,淘宝上就卖了不少Go2。
大家可能一直觉得我们做了人形机器人,会不会四足机器人顾不过来,实际上我们整个团队,包括四足和人形机器人,很多人员是共用的,四足机器人的硬件、电控系统、软件、AI算法等可以共用的地方非常多,也正好通过人形机器人把四足机器人做得更好一点,原本我们可能没有足够的人力把机器人的软件做得更好,但现在为了给人形机器人做更好的软件,会顺带把四足机器人软件也做好。
Q:宇树的机器狗全球销量达到60%至70%,是怎么做到的?现在人形机器人公司这么多,你们在人形机器人上有没有信心?
王兴兴:数据没办法完全统计,别人的销量我们不太清楚,数据可能是这个级别。我们的四足机器狗最早的技术方案是我2013年提出的,2016年公司成立,差不多也是全球最早成立的做高性能四足机器人商业化的公司,我们产品的性价比在全球做得都比较领先。
目前四足机器狗对比人形机器人肯定没有那么卷,早些年还是有点卷。做过机器狗的公司,小公司、大公司都挺多。腾讯、小米等大公司都做过机器狗,小公司就更多了,数量上不会比人形少。当下想做机器狗的公司,还有新的冒出来。
去年下半年我们人形机器人已经向全球发货了,今年也接了不少订单,具体不太方便说。至少我觉得在未来的人形机器人这个蛋糕里面切一大块,我们还是比较有竞争力。
专注硬件,对AI投入较克制
Q:今年机器人收获的疯狂关注,都包含对AI可以带来机器人进步的判断,但忽视了机器人本身的技术进步,宇树在机械和动力等方面的突破有哪些?有人评价宇树的硬件很厉害。
王兴兴:这一轮机器人浪潮主要是AI浪潮带来的,AI大语言模型可以语音交互,但要真正解放AI的能力,还需要机器人在物理层面真的去干活。
现阶段,我一直认为机器人行业最大的限制,还是AI不太够——AI模型、AI的训练数据集、AI场景的落地部署,都远远不够。硬件层面目前也不够,但是它没有理论门槛,是工程问题,把成本做得更低,外观做得更极致,硬件功能更丰富,这个时间可以预估。如果哪一天有人把AI机器人的模型做出来,找我们定制机器人,我们可以保证年底之前直接给他做10万个人形机器人。
很多人对我们公司的印象是硬件公司,我个人还挺喜欢这个标签。我们的机器狗目前在全球范围内出货量一直挺不错,再加上我们也在硬件上做了一部分软件,像Go2机器狗,就集成了Open AI的大语言模型接口,我们还整合了Open AI的多模态接口,你问他机器狗前面有什么东西,它都能给你回答出来。
我们在AI方面也做了不少,机器人本身的一些运动控制的强化学习是我们自己做的,但肯定不能跟一些纯AI公司去比。我们还是希望真正把产品做得更好,能在工厂、服务业、家用等场景真正产生价值,无论客户对我们的印象是硬件还是软件,我觉得都无所谓。
Q:宇树和电动Atlas采用的手部方案都是三指,为什么三指就够用,而不是两指或者四指?电动Atlas的头部参照的是皮克斯的灯,宇树G1的头部还会有什么新设计吗?
王兴兴:人形机器人的技术方案不是特别统一,最典型的代表就是手,有些人可能喜欢用两指,有的是三指,我们也在做五个手指的。客户们的意见也没有统一。
Atlas和我们公司的G1都用了三指。G1有点小,只有1.3米多一点,五个手指的手有点太大了,后来我们发现三指大部分产品都能用,从实用性角度出发,当然希望硬件越来越简单,不要用五个手指这么多关节。
再从使用角度出发,大家还是希望机器人的手指越简单越好。目前来说,一个电机确实能干活,但是如果要做更精细的事,比如说拿一个电烙铁去焊接,或拿一双筷子,目前只有一两个关节的手指很难实现,但是三个手指基本够用。
还有一个观点,随着AI技术的成熟,大家对硬件的需求越来越低,如果AI非常成熟,你可以认为没有手指也能干活。举个例子,有一些残疾人朋友由于不幸的原因,手掌都没有了,只有一截小臂,但他照样能做非常精细的事。所以说手不是一个大的限制因素。甚至我感觉,当未来AI成熟后,从垃圾堆里找几个关节电机,再随便找几个木头,把它们拼在一起,像个人那样搭出来,它就自己能走路甚至能干点活,这都是有可能的。头部的设计,目前我个人相对比较满意,可能短时间不会改了。
Q:很多具身智能公司都会把宇树形容成做人形机器人的身子,将自己定位于在做机器人的大脑,你认可这样的说法吗?
王兴兴:这个问题相对比较复杂,过去一年我们卖的产品比较多,也欢迎所有的客户用我们的硬件,哪怕买了我的硬件,把软件全给删了,也非常欢迎。我们过去有跟一些AI公司合作,当然我们也会做一些AI,如果不做AI,大家都不知道我们机器人的AI效果怎么样,还是要有一个初始的软件系统。机器人本体肯定是我们的立身之本,也欢迎大模型公司跟我们合作,如果对方做得比较好,我们非常愿意直接在产品上标配他们的大模型。硬件还是要为AI服务,我们要把AI做得更好一点。但说实在的,我们对AI的投入还是比较克制,确实太烧钱了。
人形机器人商业化还未成熟
Q:关于成本问题,市场对G1的价格反应很大,通过自研为什么能够做到这么大幅度的降本?很多公司的观点是现阶段降本并不是最重要的,你怎么看待降本?
王兴兴:我们希望有更合理的产品价格提供给客户,产品有人买,前提是价格相对友好。我们做四足机器人做了很多年,对机械,比如关节电机的生产、整体机械结构、传感器、整个电控系统怎么用更便宜的芯片,有比较多的经验,我们的四足机器人和人形机器人很多设计都非常类似。
目前我们一台机器狗最便宜卖到9000多块钱,对比一下,我们的人形机器人还是有点贵,因为目前人形机器人体量还没有完全起来,价格定太低对公司和整个行业都不是好事,如果明年后年出货量提升,机器人的能力也会越来越强,我觉得价格还是可以有更好的调整。
确实量大了可以降成本,这个是大家公认的。但大家公认的事,不是最有竞争的点,最大的点是在设计阶段就要做降成本的准备,每个零部件要更加简化,考虑能不能用成本更低的材料,或者本来用两个零部件的能不能用一个零部件。要把所有零部件在生产上做到极致,管理上的事情非常多,因为每个零部件都要考虑细节,有些精度要求高的零部件都是0.01个毫米起步的考量。
Q:在四足机器人方面,宇树有怎样的研发计划?未来业务是否会转型到人形机器人赛道上?
王兴兴:去年我们在四足机器人投入较大,发布了两款四足机器人Go2和B2,相对来说,去年我们反而在人形机器人上投入较少。
产品开发都有周期,我们目前没办法说每年有全新的四足机器人产品推出,公司目前的精力也顾不上,但实际上我们的四足机器人Go2和B2都有一些硬件、软件方面的升级,可能明年也会有新的四足机器人产品发布。
我们并不是说all in人形机器人,基本上还是两条路线并重。目前我们最主要的出货量来源还是四足机器人,在全球范围内,对比友商,我们的人形机器人这两年可能卖得还不错,实际上跟四足机器人来比,体量还是小一些。
Q:你之前提到过,会考虑在机器人上增加足够多的触觉感知。触觉的重要性是什么?瓶颈又是什么?
王兴兴:触觉非常重要,假设一个人全身的皮肤触觉丧失了,他可能连一个东西都抓不住,或者走路感觉不到颤动。但是目前的触觉确实非常糟糕,包括很多机械臂,基本上没有触觉,大家也在试着把触觉装上去,这样可以更好地操作,比如说考虑物体会不会滑落,会不会把物体抓坏?目前全球都在往这方面做,特斯拉的机器人手指也在装触觉传感器。
触觉传感器非常不好做,要非常小、足够敏感,要排列很多个,还有很多线缆,因为它跟物体的接触非常频繁,容易坏。最大的问题不是说不能做大面积的触觉传感器,最大的问题是它太容易坏了,比如皮肤上部署了几百个甚至上千个触觉传感器,万一磕碰,损坏的概率还是非常大,灵敏度和容易损坏一直是个矛盾。
具身智能的iPhone时刻不会超过5年
Q:今年国内外很多人形机器人宣布了「进厂打工」,虽然大多不具备实际操作能力,宇树的人形机器人的落地现状和未来规划是怎样的?
王兴兴:这是一个趋势,马斯克最早提出他的汽车工厂有人形机器人进入,这个也是目前汽车工厂比较热衷的,我们过去几个月跟蔚来的汽车工厂有合作,部署了人形机器人负责现场的搬运。目前还处于试点阶段,我觉得还没有形成真正的商业闭环,比如一台机器人它产生的商业价值是正向的,可能比人的成本还低,目前还没有到这个阶段。
我们公司目前主要是卖本体比较多,并不是说我们一定要做工业、做科研教育,AI公司或者个人买来玩我们也欢迎。但工业领域我们也在推进,比如我们希望去工厂帮忙做一些简单的生产装配和搬运,但可能推进速度没有那么快,效率没有那么高。我们对行业还是比较有耐心,不是说一定要今年或者说明年在工厂里部署多少台,我们没有给自己定目标,尊重整个的市场反应。等到技术和产品大家接触到一定程度了,已经有一些更好的商业推广的势头了,我们再大规模推广。
Q:具身智能过去一年和大语言模型一样受到了市场的高度关注,通用机器人领域什么时候会出现iPhone时刻?
王兴兴:iPhone时刻我觉得还有距离,iPhone的出现并不是说有一个特别的技术突破,更多是一个综合性的技术突破,比如说原本已经有触摸屏了,有很好的CPU,还有一些图形界面,乔布斯最后把终极产品的构想给提出来了。
目前在具身智能或者机器人AI这个领域,我个人相对比较乐观,我觉得在今年年底之前,全球至少有一家公司或者实验室能把通用型的机器人AI模型做出来,但是这个时间点,我觉得可能也不是iPhone时刻,因为iPhone时刻大家还是希望是在工业或服务业真正有终端产品出现,标志着这个行业有出货量暴增的节点。机器人的iPhone时刻我觉得稍微时间再远一点,可能还要3年或4年,但是我觉得不会超过5年。
公司档案
宇树科技
创立时间:
2016年
创始人:
王兴兴
核心产品:
● 人形机器人H1、G1;
● 消费级四轮机器人Go2、Go1、A1;
● 行业级四轮机器人B2、B1、Aliengo;
● 机械臂、激光雷达。
融资历程:
● 2017年1月,获得种子轮融资,融资金额和投资方未知;
● 2018年5月,获得天使轮融资,融资金额未知,投资方为安创加速器、变量资本;
● 2020年1月,获得数千万元人民币Pre-A轮融资,投资方为红杉中国种子基金、德迅投资;
● 2020年5月,获得Pre-A+轮融资,融资金额未知,投资方为红杉中国种子基金、初心资本、祥峰投资中国基金;
● 2021年7月,获得千万级美元A轮融资,投资方为顺为资本;
● 2022年1月,获得B轮融资,融资金额未知,投资方为经纬创投;
● 2022年4月,获得B+轮融资,融资金额数亿元人民币,投资方为敦鸿资产、海克斯康、顺为资本、容亿投资、深创投、中网投;
● 2024年2月,完成B2轮融资,投资方包括美团、金石投资、源码资本,老股东深创投、中网投、容亿、敦鸿和米达钧石跟投,融资近10亿元。
估值:
超过60亿元