36氪 - AI相关文章 前天 18:06
姜大昕走“窄门”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

文章聚焦于AI初创公司阶跃星辰,探讨其在多模态大模型领域的探索与挑战。 阶跃星辰以原生多模态为核心,试图构建端到端的AGI,但面临着技术、市场和资金等多重压力。文章分析了公司的人事变动、产品策略调整、以及在竞争激烈的AI赛道中如何寻找突破点。 尽管阶跃星辰在技术上有所投入,但其缺乏鲜明特色,面临着来自巨头和同行的竞争。 文章最终强调了技术突破的不确定性以及资金压力,阶跃星辰能否在AGI时代占据一席之地,仍待观察。

🚀 阶跃星辰的核心在于构建原生多模态大模型,期望实现理解生成一体化。

🤔 阶跃星辰在产品策略上进行调整,停止对C端产品“冒泡鸭”的大范围投入,重心转向Agent方向。

📉 阶跃星辰面临着来自其他大模型厂商的激烈竞争,缺乏鲜明的产品标签,市场存在感较弱。

💡 阶跃星辰的创始人姜大昕希望通过原生多模态技术实现突破,但该技术路线充满挑战,需要大量的资金和时间。

💼 阶跃星辰的人才流失和融资困境也对其发展带来了挑战,未来发展充满不确定性。

阶跃星辰出现了一些人事变化。

根据市象报道,阶跃星辰Tech Fellow段楠离职,任京东探索研究院视觉与多模态实验室负责人。公开信息显示,段楠最初在阶跃星辰对外身份是视频生成模型负责人,后期以Tech Fellow的头衔出现。

就在数天前,阶跃星辰被爆出在去年12月对角色扮演类Agent产品“冒泡鸭”停止大范围投入,原团队合并至对话产品“跃问”(现更名为“阶跃AI”),仅留部分员工运维。

对此,亦有阶跃员工告诉字母榜(ID:wujicaijing),去年年底冒泡鸭业务组确有裁减,但主要针对产品、测试、运维等岗位,同时,近期视频模型团队部分核心成员跟随段楠加入了京东。

阶跃星辰回应字母榜称,“早期,我们基于当时的模型能力进行了一些产品探索。2025年,随着多模态和推理能力的成熟,我们产品进行收敛,聚焦Agent方向。”

5月,阶跃星辰创始人姜大昕接受硅星人采访时曾说,“国内的大模型公司里,像我们这样重视模态的全覆盖并且坚持原生多模理念的公司并不多。我们认为多模态是实现AGI的必经之路。”

不同于OpenAI式的在文字大模型上逐步添加语音、视频以进行多模态融合的道路,姜大昕希望阶跃星辰可以做第一个迭代出端到端的原生多模态大模型。

如今,“就连阶跃星辰做的最好的视频模型团队都出走,让人担忧,阶跃拿到的资源是否能支撑他们完成设定的路线?”某头部科技大厂大模型从业者直言。

而作为去年明星创企的六家之一,阶跃并不是六小龙里最有存在感的。

相比起靠200万字上下文出圈的Kimi,借星野打出差异化的MiniMax,以及早早To B的智谱,阶跃星辰一直颇为低调,而在低调的背面,则是缺乏独特的亮点和标签,以至于在打到白刃战的大模型赛道,存在感并不强。

做一步到位的原生多模态大模型,意味着姜大昕选择了一扇“窄门”,这条路少有人行,荆棘遍布。也许它方向没错,但对需要亮点的阶跃星辰来说,逐梦AGI并不轻松,它还在等待自己的“奇迹时刻”。

A

在去年声名鹊起的AI六小龙里,阶跃星辰难得的低调。

被称为“多模态卷王”的阶跃星辰于2023年4月成立,其Step系列基座模型研发速度快,模型凡是发布就必定“量大管饱”。

无论是2024年7月一口气发布Step-2万亿参数语言大模型正式版、Step-1.5V多模态模型、Step-1X图像生成大模型,其中Step-2国内大模型初创公司首次公开万亿参数MoE语言大模型,还是今年1月一周内阶跃星辰发布了6款模型,还包括推理模型。

长期以来,阶跃星辰示人的是“人狠话不多”、埋头科研的形象。

另一面,大模型如火如荼打了一年,阶跃星辰在榜单上仍然“没有姓名”。

根据QuestMobile数据,截止2025年3月,在月活TOP15的AI原生APP榜上,六小龙里,月之暗面的Kimi从原本的第2滑到第4,月活仍为千万档,智谱、MiniMax包揽9、10位,月活不到千万,昆仑万维排在最末位,其天工AI月活为215万。

阶跃AI并未上榜,可以推测阶跃AI的月活尚未达到300万,因此并未被QuestMobile纳入榜单统计。同时,MiniMax旗下的星野为第10位,星野的成功正是阶跃星辰“冒泡鸭”业务调整的原因之一。

“去年Kimi光投流一个月能烧一亿,相比之下,阶跃AI靠的几乎是自然流量。”

就职于六小龙的某市场人员告诉字母榜,作为市场岗,财大气粗的Kimi、MiniMax有更大的发展空间,相较之下,阶跃星辰的吸引力并不太高。

阶跃星辰对投流的谨慎或许是阶跃AI“不被看见”的原因之一,不过,同样陷入窘境的还有阶跃自家的Step系列大模型。

根据chatBot Arena(知名大模型评测网站)统计,截止6月4日,在统计的242个大模型中,除了字节、阿里、腾讯等科技大厂外,创企中DeepSeek稳定在榜单前10 ,六小龙内,零一万物和智谱上榜,其中智谱的GLM-4-Plus-0111位居26位(Rank UB)。

作为颇具影响力的第三方大模型测评网站,chatBot Arena以其影响力吸引大模型企业加入测试自己的新模型,也是OpenAI 的GPT-4o的首发地。

一定程度上,chatBot Arena的排名代表了外界对大模型企业们的认知,尽管第一时间推出了自家的推理模型,但阶跃星辰的榜上无名,映射的正是DeepSeek引发新一轮竞赛后,大模型创企的尴尬。

不过,阶跃星辰也并非完全无名。

在chatBot Arena的视觉大模型细分榜单上(截止6月4日),阶跃星辰的Step-1o-Vision-32k (highres)(发布于2025年4月30日‌‌)居于21位(Rank UB),排名次于2024年6月发布的Claude 3.5 Sonnet 。此外,零一万物的Yi-Vision(发布于2024年7月)居于44位(Rank UB),是六家里唯二上榜的企业。

但在可灵AI宣称营收破亿的当下,阶跃的视频大模型对开发者的吸引力有限,此番视频模型团队的调整,也让其技术迭代速度面临更艰巨的挑战。

同时,在人才密度空前之高的大模型赛道,阶跃星辰的创始团队也低调到少了些亮点。

2023年创业之前,创始人姜大昕是微软全球副总裁,主导过微软搜索引擎Bing,微软云Azure、办公全家桶Microsoft 365等产品的自然语言理解系统。

尽管有微软背景,但在大模型领域,创业者有杨植麟这样带着“天才少年”标签的,还有如王小川、李开复这样的成功创业者,露面不多的姜大昕知名度并不算高。

此外,作为位列AI六小龙的必备要素,相比起月之暗面自2023年初成立以来融资规模超110亿元、智谱的国资频频加持,在六家里,阶跃星辰的融资规模并不是最多的,单轮的融资额也不是最高的。

奔向AGI一年多,阶跃星辰似乎缺了些亮点。

曾经,谈及从微软出走创业,姜大昕引用了大学好友的一句话“这个世界上每天刮很多风,但这个风刮到你家门口,一辈子就那么一两次”。

如今从顺风局打到逆风局,阶跃星辰势必需要尽快地拿出成绩来证明自己。

B

“我咨询开发者平时使用哪家大模型做基座来做APP或Agent开发时,几乎没有听到过阶跃的名字。”

在某科技大厂做AI产品经理的陈然(化名)告诉字母榜,尽管阶跃星辰多模态模型占比极高,样样都全,但似乎成了开发者眼中的大模型调用备选项,“论便宜、版本又多的有阿里通义,论文本分析场景特长有DeepSeek、Kimi,阶跃缺了点存在感和记忆点。”

而阶跃星辰“无名”的背后,正是因为选择了一条少有人走的路。

客观来看,在公认多模态(视频+语音+文本)是AGI最终形态的当下,更成熟的技术路径,是基座大模型从文本到语音到视频的小步慢跑,先独立发展,再互相铺垫迭代到多模态大模型。

以OpenAI为例,Sora和ChatGPT分成两种不同的算法和架构推进,同时阶段性迭代,成熟后再融入同一套基座大模型,这也是国内大模型厂商的普遍选择。

不同模态,也就有不同的算法和结构,拼装出的多模态如何整合统一最终丝滑配合也成为了当下的新难题。

对此,姜大昕在接受硅星人采访中曾说“去年大家对Sora感到兴奋的时候,我们非常失望。”原因正是由于阶跃星辰团队认为大模型发展的主线是理解生成一体化,但Sora没有在这个路线走,走弯了。

阶跃在当下要走的是一条比OpenAI更激进的路线,即挑战端到端的原生多模态大模型。一步走到位尽管激进,一旦成功也必然是巨大的技术突破。

在姜大昕的办公室门牌上,曾经挂着他手绘的Logo,灵感正是来自阶跃函数(Step Function)——神经网络中最早的激活函数,用折线图表示时,就像往上攀登的一级台阶。

这不仅是公司的名称和Logo,也寄托着阶跃的技术野心。这些也促使它在通往多模态的两条路里,选择了人迹罕至的那一条。

而对于阶跃星辰来说,它接下来要做的事情足够宏大,也足够难。

希望能够一步走到位的阶跃星辰,选择收束C端应用,也正是因为想要实现这个目标,其技术复杂性更高,因而无暇顾及其他“烧钱”还成果微薄的业务。

于是,在阶跃星辰成功前,相比起使自家大模型在文本、语音、视频生成等任一维度拔尖儿,阶跃星辰的重心会落在原生多模态模型的内部调整,这也造就了阶跃大模型的缺乏亮点。

也是基于此,阶跃星辰注定无暇他顾。

尽管阶跃星辰在“冒泡鸭”业务爆出调整时回复称,将在汽车、手机、具身智能、IoT等关键应用场景的智能终端和Agent布局,比如与吉利汽车拓展“AI+车”的场景,还与智元机器人达成战略合作,探索AI+具身机器人应用场景,但阶跃的探索似乎并不深入。

需要注意的是,首个通用Agent的概念已被Manus锁定,阶跃已经失去竞争通用Agent入口的先机。

参考2月阶跃与OPPO 的合作,阶跃为OPPO的智能助手小布提供“一键全能搜”、“一键问屏”(拍照识图)的服务,在Agent产品经理欧昆(化名)看来,“这是目前大模型厂商和B端用户最直观和基础的合作形式,并未涉及到基层调整,只是feature 级别的叠加,参考OPPO,阶跃与吉利汽车的合作,是否能拿到底层车机的系统权限,还是只做车载助手呢?”

或许这对阶跃来说是最保险的合作形式,阶跃能够借此“换量”获得用户,OPPO也能进一步夯实AI手机的概念。

欧昆告诉字母榜,小鹏、理想等汽车正在开发垂类Agent,阶跃借助车载助手的合作形式,在数据源上难免落后于车企自身的agent。

而不管是否与企业深度合作,以及基于有限的数据input,能不能拿出亮眼的Agent功能,还要看阶跃Agent团队的答卷。

姜大昕在接受媒体采访中表示,阶跃星辰的差异化特点就是多模态能力,多模态领域存在着非常巨大的机会。

这是姜大昕眼里阶跃星辰最大的亮点,但在外界看来,一步到位的多模态大模型仍然在PPT阶段,似乎难以获得直观的感知。

在竞争异常激烈的大模型赛场,去年迅速崛起的六家里,每一家都有其标签。月之暗面是长文本,智谱是B端市场,Minimax是垂类陪伴赛道,百川是医疗。相较之下,求全的阶跃星辰似乎少了些标签,因此也就少了些记忆点。

C

多模态的“GPT-4时刻”还没有到来,“有的时候它的突破就在一瞬间。”

在采访中,针对视觉模型,姜大昕形容目前很多方案是“胶水模型”,把多个模型拼凑起来的思路不会是最终的形态。他希望自己能成为实现视觉模型一体化的那个。对于未来,阶跃星辰无疑是乐观的。

但对于阶跃来说,无法忽视的是一个悬在头顶的问题,阶跃星辰的“AHA moment”何时来临?

姜大昕曾在采访中有类似的表述,他说,“有的科学突破可能在积累上早就发生了,但有点像大家说的‘涌现’,只看到‘砰’地一下上去了,是一种跳变。但这个朝着目标迈进的过程,只要没有达到那个点,它就是0。”

正如姜大昕所说,技术突破何时来临不好预测。

更危险的是,一旦阶跃被别家抢先,那么被姜大昕视为其最大亮点的原生多模态大模型也将失去。阶跃星辰的定位,恐怕会比现在更加尴尬。

在大模型抢人大战下半场,巨头们如腾讯、阿里、字节等,创企如Kimi、MiniMax、智谱等,都有着背景殷实的技术团队。技术瓶颈突破的不确定性是大模型厂商们都需要面临的问题,但无论选择那条路,时间都不等人。

此外,需要继续烧钱的阶跃,也需要给投资人们讲新故事了。

进入2025年,国内大模型融资几乎停滞。同为明星创企,Kimi如今还未正式推出自己的视频生成模型,而OpenAI在宣称的400亿美元融资到账前,Sora也并未有新的进展,都是因为足够宏大的目标背后,需要更多的资金。

“现在投大模型公司,主要就两个核心要点,第一个是容错率,第二个是成功的概率。”

恒业资本创始合伙人江一告诉字母榜,尽管阶跃星辰的野心不小,但投资人首先考量的正是技术路线目标能否达成,如果偏差太大,资本恐怕难以买单。

对“没有亮点”的阶跃星辰来说,它还需要找到愿意为它的远大愿景买单的投资人。

此前在智能涌现采访中,谈到ChatGPT带来的冲击,姜大昕形容“感觉整个世界在身边呼啸而过,留下自己在风中凌乱。”彼时茫然的他选择跳出微软创业,为“有时候风冲的方向跟我好像还挺一样的”而高兴。

如今,当风冲的方向与姜大昕相反,打逆风局的阶跃星辰想要坐稳牌桌,恐怕要准备新筹码了。

参考文献:

《阶跃星辰To C产品“冒泡鸭”将停运,重心转向终端Agent|智能涌现独家》,来源智能涌现。

《独家|阶跃星辰Tech Fellow段楠离职,任京东探索研究院视觉与多模态实验室负责人》,来源:市象。

《对话阶跃星辰姜大昕:Sora技术有局限,多模态理解生成一体化才是未来》,来源:界面新闻。

《对话阶跃星辰姜大昕:我们就是“多模态卷王”》, 来源:硅星人。

《闭关一年创业大模型,姜大昕站在AGI呼啸的风中》,来源:36氪

本文来自微信公众号“字母榜”(ID:wujicaijing),作者:马舒叶,36氪经授权发布。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

阶跃星辰 多模态大模型 AGI AI创业 技术挑战
相关文章