动点科技 前天 17:10
现场深度观察:原来 AI 已经悄悄“卷”成这样 |WAIC 2025
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

2025世界人工智能大会(WAIC)展现了AI产业的最新动态,聚焦算力、模型、Agent和应用等多个关键领域。算力方面,国产替代加速,华为昇腾384超节点展现强大性能,RockAI的Yan 2.0则突破Transformer架构限制。世界模型作为降低数据成本的新希望,商汤“绝影开悟”和腾讯混元3D世界模型预示着未来AI发展方向。AI Agent从实验室走向产业界,正在重塑生产力,未来有望成为“AI员工”。多模态内容创作,特别是视频生成,正成为AI变现的重要途径。具身智能则从表演走向实用,强调在工业场景中的实际应用能力。本次大会也反映了AI产业从通用技术向垂直领域深耕的战略转变。

💡 **算力自主与国产替代加速**:在算力芯片领域,H20芯片算力已显落后,华为新一代910C表现亮眼。面对安全问题和出口限制,国产替代进程刻不容缓。华为推出的昇腾384超节点,作为业界最大规模的超节点,通过高速总线连接多颗NPU,突破了互联瓶颈,在Llama3等模型训练上性能提升显著。RockAI的Yan 2.0非Transformer大模型,以3B参数量达到Llama3 8B水平,尤其适用于对功耗和性能要求极高的设备。

🌐 **世界模型降低数据成本,赋能未来AI**:世界模型旨在通过对环境规律的建模与虚拟仿真,减少对真实世界数据的依赖。Meta的V-JEPA 2进展,商汤科技升级的“绝影开悟”世界模型,以及腾讯开源的混元3D世界模型1.0,都预示着AI将在理解世界运作规律、预测未来状态和指导决策方面取得突破。视频生成模型被认为是构建世界模型的最佳路径,能够实现从感知到认知的跃迁。

🤖 **AI Agent从实验室走向产业界,重塑生产力**:AI Agent(智能体)的爆发式增长是2025年科技领域的重要现象。多家企业展示了已实现商业化落地的Agent技术,覆盖企业服务、工业智能等领域。Windsurf的沉浸式编码Vibe Coding吸引了科技巨头关注,而Agent开发范式的革新降低了开发门槛。未来12-24个月,AI Agent将从“工具辅助”走向“任务承接”,成为“AI员工”,推动企业从成本工具向价值创造转变。

🎬 **多模态内容创作与变现新路径**:内容创作是AI应用和变现的关键垂类。AI能够实现跨文本、图像、音频和视频的多模态内容制作,经济高效且扩展性强。视频生成领域,AI有望通过提高制作效率、降低创作门槛和解锁新变现模式来重塑内容行业。国内的可灵、豆包Seedance和海螺AI等正在迅速崛起,与海外Sora、Google Veo 2等产品共同推动AI视频生成技术的竞争与发展。

🛠️ **具身智能回归实用,赋能工业场景**:具身智能的发展趋势已从单纯的表演转向实际应用能力。在复杂的工业环境中,仅有花哨的表演不足以应对任务,需要具备精准的感知执行能力和对工艺机理的深刻理解。具身智能的发展必须回归实用,提升机器人在工业场景中的实际应用能力,才能在市场竞争中占据优势地位。

2025年的世界人工智能大会(WAIC)已经落下帷幕,作为全球 AI 领域的重要展会,今年依旧吸引了不少从业者和关注者。走进展会现场,能看到各种新发布的技术产品和解决方案,从芯片算力到智能应用,覆盖了 AI 产业的多个环节。这些展示不仅反映了当下行业的发展状态,也暗藏着未来技术落地的线索。在此,动点科技结合现场观察,聊聊这次展会里值得关注的几个方向。

算力供求:从泰山到鸿毛

在算力芯片领域,近期局势可谓风云变幻。黄仁勋在近期的访华日程中带来了美国恢复对华供应H20芯片的消息,然而,H20 芯片的算力在当下已难以跻身主流之列。与此同时,华为论文显示,新一代910C实测效率已超过英伟达H100水平。另一方面,近日,英伟达算力芯片被曝出存在严重安全问题。此前,美议员呼吁要求美出口的先进芯片必须配备“追踪定位”功能。因此,即便英伟达能够对华出售最先进的AI芯片,国产替代进程也刻不容缓,不得不加速。

在这样的背景下,华为推出的昇腾 384 超节点(Atlas 900 A3 SuperPoD)格外引人注目。作为业界最大规模的超节点,算力总规模达300Pflops(Pflops:每秒执行10的15次方次浮点运算)。昇腾超节点通过高速总线连接多颗 NPU,突破了互联瓶颈,让超节点像一台计算机一样协同工作。

这台超节点使得数据传输速度大幅加快,并减少了数据处理等待时间,使数据交互更加流畅。在性能方面,经过实际测试,在昇腾超节点集群上,LlaMA3 等千亿稠密模型训练性能可达传统集群的 2.5 倍以上;在通信占比更高的 Qwen、DeepSeek 等多模态、MoE 模型上,性能提升更是可以达到 3 倍以上。

现场人山人海,难以拍到 384 全貌,故在此选用大会主办方配图

与华为的大型基础设施产品不同,RockAI则显示了四两拨千斤的模型能力,其打造的Yan 2.0 Preview是非Transformer大模型的代表,能以3B参数量达到Llama3 8B的水平。尽管Transformer架构在大模型时代被大厂们奉为圭臬,但是面对手机、小型机器人、小家电、智能眼镜等对功耗、性能要求极端的产品,Yan架构大模型将有用武之地。动点科技在WAIC现场看到,机器狗在无预设程序的情况下,依托自主学习能力(工作人员给其播放相应的视频)快速完成学习并执行动作。

世界模型:降低数据成本的新希望

随着大模型的不断演进,数据采集成本日益成为制约其发展的重要因素。在此背景下,世界模型的发展备受关注。Meta 首席科学家 LeCun 一直致力于世界模型的研究,并在 6 月 12 日的视频中介绍了 V-JEPA 2 的新进展,坚定了继续探索世界模型的决心。

世界模型作为人工智能领域的核心概念,尚无严格统一的定义,但其本质可概括为智能系统对物理或虚拟环境的内在抽象表征,用于理解世界运作规律、预测未来状态并指导决策。与传统AI模型相比,其更追求物理规则泛化与跨场景适应。​

在本届大会上,商汤科技带来了升级后的“绝影开悟”世界模型,这类世界模型的推出,能够批量生成高风险、低概率的驾驶场景,无需依赖真实路测采集。与此同时,腾讯也正式发布并且开源了混元3D 世界模型1.0,用户只需要输入一句话或者一张图就能够在几分钟之内生成可漫游的3D世界,对于输出标准化的3D 资产,大幅度缩短生产周期有所帮助。开发世界模型的核心逻辑在于通过对环境规律的建模与虚拟仿真,减少对真实世界数据的依赖,甚至可以通过“虚拟数据反哺真实场景”的方式降低数据采集需求。

在WAIC 2025的“启明创投·创业与投资论坛”上,前腾讯杰出科学家、混元大模型技术负责人,Video Rebirth首席执行官刘威表示,视频生成模型是构建世界模型的最佳路径,这一技术方向有望成为AI从感知向认知跃迁的关键突破口。

在技术框架上,刘威提出世界模型应具备模拟、预测、探索三大核心能力。模拟能力对应仿真功能,属于快思考的感知层面;预测能力实现因果推理,进入慢思考的认知层面;探索能力支撑规划决策,是主动思考的体现。这三大能力相辅相成,构成了世界模型的关键所在。

AI Agent:从实验室走向产业界

2025年,AI Agent(智能体)的爆发式增长已成为全球科技领域最显著的现象之一。从WAIC 2025展会现场看,多家企业展示了Agent相关技术,其中部分甚至已实现商业化落地,覆盖企业服务、工业智能、金融科技等核心领域。

AI编程初创公司Windsurf凭借(沉浸式编码Vibe Coding)的特色,通过结合 AI 助手与独立代理功能,支持多文件编辑、自然语言命令执行、上下文感知等智能化功能,帮助开发者在编写代码时保持“心流”状态,年经常性收入(ARR)在4月份已达约1亿美元,吸引了科技巨头们的关注。OpenAI原计划斥资30亿美元收购,但是不久前,谷歌宣布将聘用 Windsurf 的 CEO Varun Mohan、联合创始人 Douglas Chen 以及部分研发员工,加入谷歌 DeepMind 团队。

这一现象的根本驱动力在于大模型能力的跨越式提升。基于智谱自研的推理模型GLM-Z1-Air训练出的AutoGLM沉思模型,已经能够做到实时操作浏览器,像真人一样打开网页、检索信息、生成报告。

此外,Agent开发范式的革新(如Anthropic的MCP协议、智谱的WebRL强化学习框架)大幅降低了开发门槛,使得企业无需专业技术团队即可快速定制专属Agent集群。这些技术突破共同推动Agent从“被动执行指令”转向“主动创造价值”,最终引发了这场从实验室到产业界的生产力革命。

在WAIC 2025期间,启明创投主管合伙人周志峰指出,未来12-24个月,Agent形态将从“工具辅助”走向“任务承接”,首批真正意义上的“AI员工”将进入企业,广泛参与客户服务、销售、运营、研发等核心流程,不再仅作为助手存在,而是具备协同作业、主动反馈、承担OKR等能力,推动从成本工具向价值创造转变。

AI 应用:多模态下的内容创作变现之路

在 AI 应用领域,具备多模态能力的应用已成为常态。目前,Deepseek、豆包、腾讯元宝等 AI 应用深受大众喜爱,日常使用度颇高。然而,对于行业而言,如何利用 AI 应用实现变现,充分发挥大模型的价值,仍是亟待解决的关键问题。

瑞银证券熊玮指出,内容创作是关键AI 应用和变现垂类。“我们看到AI能实现跨文本、图像、音频和视频的多模态内容制作,扩展性强,经济高效,而且视频创作在 AI 商业化方面进展迅速。需求端,我们预计电影/电视剧、广告和游戏开发中用例广泛,AI 生成的视频可显著降低制作成本。供应端,模型能力的持续改进和推理成本的下降将推动更广泛的应用。我们认为 AI 视频生成有望通过提高制作效率、降低创作门槛和解锁新的变现模式来重塑内容行业。”

在视频生成领域,海外有 Sora 和 Google Veo 2 等产品,国内的可灵、豆包 Seedance 和海螺 AI 也在迅速崛起。熊玮表示:“中国模型在 AI 视频生成领域取得初步成功。虽然我们注意到美国和中国的头部公司在大模型领域有所整合,但 AI 视频生成模型的竞争还处于早期阶段,一些中国公司已成为该领域的早期领导者。”

具身智能:从表演走向实用

本届WAIC的具身智能展区可谓是神仙打架,跳舞、冰壶击打、递物盖章、分发传送快递……在这场技术盛宴中,一个关键趋势愈发明显:对于具身智能的发展而言,仅依靠花哨的表演远远不够。若缺乏对工业现场的感知执行能力,机器人在面对复杂多变的工业环境时,将难以精准应对各类任务,无法实现高效、稳定的作业。同样,缺少对工艺机理的深刻理解,机器人便无法依据不同工艺的特点与要求,进行智能决策与操作优化。

只专注于打造表演型机器人,虽然能在短期内吸引眼球,但从长远来看,这类机器人由于功能的局限性,难以在实际生产中发挥重要作用,也无法满足工业领域日益增长的智能化需求。在激烈的市场竞争中,这种缺乏实用性的发展模式很难助力企业进一步做大做强,更难以在产业链中夺取优势地位,掌控核心话语权。因此,具身智能的发展必须回归实用,注重提升机器人在工业场景中的实际应用能力。

结语

从算力自主可控到模型轻量化普及,从数据成本优化到智能体生产力释放,每一条技术路径都在重构行业的边界与规则。

这场盛会中,缺席者也值得注意。百川智能与零一万物已经将重心转向垂类医疗模型与企业级业务,虽未出现在展会现场,却折射出 AI 产业发展的另一维度:当通用技术赛道日趋拥挤,深耕垂直领域、解决具体行业痛点正成为另一种战略选择。而无论是展台前沿的技术突破,还是幕后深耕的垂直探索,都将共同构成2025年AI产业的真实生态。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

WAIC 人工智能 算力 世界模型 AI Agent 多模态 具身智能
相关文章