原创 王兆洋 2025-06-12 10:29 上海
围绕AI重塑一朵云,是成为一家“创新科技公司”的第一步。
01
火山引擎的名字里没有云。
这件事在以前是个需要解释的事情。2020年底,字节内部的关键决策会议上,正式决定让火山引擎对外提供服务、进入真实的市场,而在这个最初的会议上,字节希望这个技术平台不只是“又一个云计算厂商”。于是干脆从名字就不带云。
在火山引擎进入这个市场的时刻,云计算正处于焦灼的互卷阶段。这是一个需求旺盛的市场,也是一个充满诱惑的商业战场,用高举高打的方式收割一个增长中的市场,它符合外界对弹药充足的互联网巨头们决策思路的想象。而这样的思路之下,一个产品的名字怎么能不带“云”呢。
在这些最初的内部会议上,字节对火山引擎的思考呈现出这家公司有些容易被人忽视的一面。据参加会议的人员回忆,最初的各种内部会议上,花最多时间讨论的除了认定云市场必须用新方法来找差异化,不去抢那些低垂的果实之外,大家更多在讨论两件事。
一件是,“20年后回头看今天,云计算是什么样?”
答案是省、稳定和安全这些基本要求依然必不可少,但同时肯定不能依然只是做CDN等资源的“售卖”,技术栈需要变化。
而更重要的另一件事,是这个从内部正式开启对外服务的基础技术平台,对于字节这家已不再是“后来者”的公司自己来说,到底意味着什么?
讨论最终的答案是,它要寄托字节自己真正变成一家科技公司的期待:当时的字节在推荐算法等技术上已经是领先者,但它的基础设施是建立在外界服务之上的,想成为一家“科技公司”,字节不可能不对云和底层技术也充满野心,因此它一方面要建设自己的底座,另一方面必须让它得到最充分的考验——到最复杂的真实市场里去。
这是很字节的一套做事风格——这家公司是诸多科技公司中,最喜欢以终为始设计业务的公司之一,只不过很多时候它被大家津津乐道的是那些方法论,忽略了它对终局的执念,多名在字节关键决策节点参与最核心讨论的人士都讲述过相似的故事,今日头条和抖音是从“算法如何改造信息分发”的灵魂拷问出发而诞生,而火山引擎的故事同样由此开始。
对火山引擎的两个灵魂拷问相结合,答案就指向了AI。
02
2025年6月11日,火山引擎参与人数破纪录的最新一次原动力大会上,展示了一组数据:
截至今年5月底,豆包大模型日均tokens使用量超过16.4万亿,较去年5月首次发布时增长137倍。
Token使用量这个指标可能不如营收数据更能直接体现商业化情况,但在今天AI用量快速爬升阶段,它是各家都紧盯着的风向标。前不久Google公布其系统每月处理的token数量激增,从去年的9.7万亿增加到现在的480万亿,这里面包括Google系的各种C端调用。
“据IDC报告,豆包大模型在中国公有云大模型市场份额排名第一,占比达46.4%。”火山引擎总裁谭待在会上引用数据称。
于是,当AI快速成为计算需求的最主要来源,火山引擎的名字里没有云这事终于也成了不太需要解释的事情——计算的需求结构都要彻底变了,能支撑它的必须是全新的围绕AI的基础设施,那么今后能吞下这一切的,自然不是过去那朵“云”了。
而且,这一切只是开始。Token疯涨以及依然会涨下去的根源来自于市场对AI的需求模式的变化。
“我们看到模型的训练正在从预训练向后训练转移,对大部分企业来说后训练是一个很重要的事情,而以强化学习为代表的后训练实际上对基础设施提出了更高的要求。”谭待提到。
火山引擎完整经历了这轮AI算力需求的轮转。从第一天对外开始,字节在它身上的“私心”就是让全市场来测验它用来支撑自己最核心技术的底层能力,而字节的技术核心一直是AI和算法——火山引擎从诞生就是死磕AI的一个新型基础设施平台。
ChatGPT的震撼一度让行业有种“断代”的意味,似乎在它出现后,此前的一切都不做数了。但事实上,今天AI和算法的进步不是抹掉一切重新开始的,它背后有一整个历史。此前在推荐算法上的理解和积累,依然会对今天有帮助,它让火山引擎在关键节点上更加敏锐。
这从火山引擎的变化中也可以直接感受到,在2020年底正式对外开放后,它一度更多在给外界提供字节自己验证过的、围绕模型背后的产品,从A/B测试到数据平台,这些更多是一些零散的单点产品。
2021年,火山引擎开始提供更接近通常理解的云的服务,直到2023年6月火山方舟出现,围绕模型构建的系统成型,开始对外提供围绕AI的系统化的服务,之后这样的思路不断加强。
也就是,AI是火山引擎正式变成一个底层设施的根本原因,也是它一切技术产品设计和改进的出发点,这使得2023年当时,火山引擎甚至在字节自己的豆包模型亮相之前率先跑了出来。火山方舟发布时,集成了国内外多家大模型,面向企业提供精调、评测、推理等全方位的平台服务。而同样的思路在DeepSeek R1出现后,呈现的更加明显,火山引擎迅速成为最先接入和服务最稳定的平台,最终也变成企业级DeepSeek调用最多的平台。
DeepSeek证明了围绕模型做基础设施的极致改进,可以突破现有的云的限制,进而发展成为一个在商业上也可持续的新的基础服务。这正是火山引擎自己在追逐的,于是动作也就迅速。
另一个最直接的体现,就是外界热衷讨论的“价格战”。
2024年5月,火山引擎公布了自己在模型调用上更低的定价,这一度被理解为一种云计算竞争的常见手段的再次上演。但在整个行业一系列的跟进动作后,人们很快意识到,在新的token规模经济之下,当你围绕模型和AI做工程化的极致改进,随着模型继续进步和软硬件的一系列优化后,这种价格下降是必然结果。
而在6月11日的原动力大会上,谭待干脆带着现场的人们做起了口算题。“在绝大部分企业请求输入落在的32K范围以内,经计算豆包1.6成本只需要不到原来的三分之一,就能获得一个能力更强,原生多模态的新模型。”
“我们的营收里,与大模型相关的业务贡献最多,毛利也是最好的。”谭待表示。
当初用来打入这个市场的能力,变成市场结构突变后决定未来竞争格局的最关键能力。而火山引擎的差异化也随着需求的改变,呈现得更加清晰。
03
云计算永远是个规模的生意。
这个判断在之前被用来解释新入场的玩家面对的挑战之大。但事实上,这句话放在今天更重要的意义在于,“规模”的核心是会改变的,这也正是今天正在发生的最重要的事。
AI注定会吞掉云的一切需求,成为当仁不让的主角。
在火山引擎的判断里,这个变化在三个维度展开:一个是推理能力进入视觉和多模态模型里,带来应用爆发;二是视频生成大规模进入真实生产环境;第三就是AI Agent走向彻底的普及。
而这些变化也对支撑这些需求的技术带来新的要求,本质上是云计算从围绕资源利用和弹性普及,变成了要围绕算法模型和AI本身来进行计算提效优化的技术。
其中最重要的就是AI Agent眼看要到来的井喷。
“2025年是AI agent的元年。”谭待说。他认为,AI agent背后核心突破在于将大模型的语言理解能力与环境交互、工具调用深度融合,形成目标导向的自主执行系统。
软件第一次从被动的工具,变成主动的执行者。AI从交付一个中间过程半成品,到交付结果。
根据火山引擎的判断,随着大量Agent加速进入现实世界,强化学习带来的整体算力消耗和IT 支出有可能在2027年附近逼近整个行业在预训练上的投入。
“如果我们把时间拉长,把技术栈展开。我们实际正处于PC到移动到AI 三个时代的变化之中。在这三个时代里,技术主体在发生变化,PC时代的主体是web,移动时代是APP,AI时代是Agent。”他说。
它需要一次更彻底的重构。在火山引擎的最新更新里,它不再想被过去人为划分出来的各种分层来束缚,转而根据需求来源的判断,设计了对应的核心三件套。
“我们把这些基础能力原子化,作为三个方案提供给大家,分别是AgentKit,TrainingKit和ServingKit。”谭待说。
在火山引擎内部,他们把AI agent定义成多步骤复杂任务,他们相信这会带来一个全新的产业。
AgentKit就是对围绕Agent打造的工具和平台进行的一个整体的SDK封装,集成了最新的大模型,开箱即用,强调高可扩展能力。同时,它已经集成了业界数十类三方MCP Server。
另外的Training Kit和Serving Kit也对AI agent的需求提供支持。Training Kit实现高达 60%以上的MFU(算力利用率),在万卡集群、千亿参数的规模上对比开源的方案提升了30%。ServingKit解决的则是模型在推理过程中的效率问题,它强调其通过支持对各种开源框架的优化、对主流模型的算子优化,在性能上比社区的最新版本提升了2-3倍。
观察这些产品,其中一个最突出特点是,你平常在关于模型训练和推理上听到的技术,都直接变成了这个云平台可以提供的服务。比如后训练的强化学习、MCP、数据蒸馏,都产品化了。与传统云厂商的产品技术栈划分还需要“翻译”相比,它们如今都直白的放在用户面前。
“过去几年传统云计算在产品层面的创新,其实停滞许久了。”谭待对硅星人说。“今天AI让云上的产品可以像最早期那样,有更多创新和产品出来。”
火山引擎把这些产品和技术的重构称为AI云原生。在大模型带来各种fancy的新名词里,这显得没那么吸引眼球。但它足够直接——AI的原生需求变成云最重要的部分,然后云这件事就此改变。
04
火山引擎的进展速度,有时候让人们几乎忘了它是个诞生刚五年的业务。
6月11日的原动力大会上,你能从每个角落感到它在这场竞争里的转折点已经到来。同时在字节跳动的体系内部,它也正在成为新的焦点。梁汝波在大会上以视频形式亮相,这也是这位CEO第一次出现在火山引擎的发布会。
“做好火山引擎,对字节跳动成为一家优秀的科技公司,保持技术竞争力很重要。”他在开场时说道。
字节要成为一家真正的科技公司,但所谓的科技公司也有很多种,它要成为哪一种?
“优秀的科技公司是能够运用先进技术的公司,而优秀的创新科技公司是能够探索和发明新科技的公司。”
而字节一直以来的技术创新,其实有一个不变的线,就是对一个系统的整体探索。今日头条是“内容生产+分发+反馈”系统,抖音是“兴趣识别+推荐反馈+内容供给”系统,飞书是“组织协作+工作流程+数据驱动”的企业操作系统。
火山引擎也延续了这种路线,“AI云原生”这条路也并非孤立的技术选型,更多是字节存在在肌肉记忆里的创新方式在AI时代的投射。但它比以前更进一步,从对技术的运用,到需要对整个系统重新发明——这个系统不再只是AI跑在上面的“云平台”,而需要就变成AI本身。
“就好像原来的后训练是一个星球,一个地球,一个火星。但是未来大家看到的后训练将是一个太阳系。”火山引擎智能算法负责人、火山方舟负责人吴迪在一个小范围交流里提到。
他形容火山引擎在这飞奔的两年里,最大的经验之一是把AI放在更长的视野里来看。
“不能只看模型本身,AI 的综合能力本质上还是计算机科学的一部分。整个系统的服务能力要够强,你要把它当成一个完整的计算机系统来看,这件事情特别重要,而且也才是我们长期能够把性价比做到最优的一个根本性保障。”
除此之外,火山引擎也是字节这家公司从一个互联网行业后起的挑战者变成一个在技术上对全行业有更广泛影响力的成熟科技公司的过程的某种浓缩。
对于一家通过C端产品获得巨大商业化成功而迅速成长的公司,如何在内部建立起来一个新的团队,甚至新的文化,去“苦哈哈”地拓展to B的业务,是每个有野心变成真正的科技公司的年轻企业都要面对的问题。
互联网产品的成功好处在于让火山引擎可以有更多选择空间,但也会带来“挑剔”的问题,当一个需要投入大量时间和人力的客户,换回的收入还不如某个广告位的售价,这种影响是很微妙的。这背后,如何理顺to C和to B之间的关系,至关重要。
而变化发生的关键依然是AI。随着大模型的需求吞噬掉一切,那些中小创业者成为token消耗贡献者,而更重要的,过往主要在和数据中心打交道的云计算服务,今天开始更加直接,更向C端靠拢。
字节的C端积累比以前更能服务于火山引擎这样的B端产品的拓展:一个企业老板很可能用豆包APP的视频通话来分析自己的体检报告,他自然可以理解用火山引擎建立一个他自己企业的“豆包”,去识别他生产车间上的关键要素。
长期以来,字节强大的技术实力被其耀眼的C端产品光芒所掩盖。而现在它寄托了自己成长为一家创新科技公司的愿望的to B业务,与从头条与抖音等产品延伸下来的to C模型产品等,第一次因为AI而更紧密的贯穿在了一起。这都让火山引擎能成为一种对外的统一出口。
“一直以来,字节在技术创新上的投入是非常大的。未来,我们也会秉持此前的理念,通过火山引擎持续把我们的新模型、新技术开放给企业客户,让新技术接受市场的检验。”在当天的开场里梁汝波说。
这是字节等待许久也努力营造了许久的时刻,火山引擎不只是一个“云”,它有字节更多的想象,也有机会变成这家公司再往前蜕变的一个支点。
火山引擎让字节跳动终于可以干它一直想干的事了。