【国盛计算机】Grok 4发布，Scaling Law延续

国盛计算机 16小时前

马斯克旗下xAI公司发布了Grok 4模型，标志着大语言模型能力的持续进步。Grok 4在推理能力和上下文窗口方面表现优异，并采用了更高效的参数利用。文章还探讨了Scaling Law对模型发展的重要性，以及Agent作为AI新增长引擎的关键要素，包括数据、模型和接口。此外，文章还分析了Agent在不同行业中的应用，并提出了相关的投资建议。

🚀 Grok 4是xAI发布的最新大语言模型，在推理能力基准测试中表现优异，参数效率和上下文窗口均有提升，并支持代码和多模态输入。

💡 Grok 4的训练使用了超过20万张H100 GPU的超级计算机集群，训练量是Grok 2的100倍，这表明扩大算力对模型能力提升至关重要。

🔑 Agent是AI新增长引擎，其三大核心要素是数据、模型和接口。其中，垂类数据是Agent拓展到各行业的关键，基础模型的强大是Agent进步的核心动力，而接口则扩展了Agent的工具使用能力。

刘高畅/陈泽青 2025-07-13 12:10 上海

核心观点

马斯克旗下xAI发布Grok 4，大模型能力前沿持续推进。2025年7月9日，马斯克旗下AI公司xAI发布Grok 4模型。Grok4模型参数量约为1000-1750亿，与竞争者相比，Grok 4在推理能力基准测试中拥有更优表现（35%-45%），拥有更长的上下文窗口、以及更高的参数效率。该模型性能优越但定价不菲，彰显出xAI对其能力的信心。我们认为，Grok 4的发布表明了大语言模型能力前沿的持续推进。伴随着xAI未来的模型发布计划，AI产业落地有望进一步推进。

Scaling Law延续，算力依旧为大模型进步基石。Grok 4的训练是在超过20万张H100 GPU的超级计算机集群上完成的，是Grok 3时期的两倍。xAI改变了训练策略，将更多的算力投入到“推理能力”的专项训练上。相比于Grok 2，Grok 4的训练量提升了整整100倍。xAI官方表示将继续将强化学习扩展到前所未有的水平，以Grok 4的进步为基础，突破AI智能的界限。我们认为，Grok4的能力提升表明了Scaling Law依然有效，扩大训练算力对模型能力的提升依然起到至关重要作用。

Agent成为AI新增长引擎，三大要素：数据、模型、接口。我们认为Agent的三大核心要素包括数据、模型和接口1）垂类数据是Agent能力拓展到各行业的关键，如飞猪的Agent“问一问”接入了自己的机票报价引擎，平台积累的用户评价数据也被深度整合进推荐算法。2）更强大的基础模型使Agent能够处理更复杂的多步骤任务规划，模型的上下文理解能力也对Agent准确识别任务需求与工具的匹配关系至关重要。3）Agent需要通过各类接口与外部系统交互，获取上下文或执行操作，也即使用工具扩展Agent能力。MCP协议的普及进一步降低模型打通各数据源和工具接口的开发成本。

建议关注：

算力：寒武纪、海光信息、阿里巴巴、协创数据、有方科技、奥飞数据、沪电股份、新易盛、东阳光、胜宏科技、中际旭创、东山精密、伟仕佳杰、云赛智联、潍柴重机、科华数据、禾盛新材、浙数文化、大位科技、玉柴国际、亿田智能、宏景科技、弘信电子、圣阳股份、利通电子、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份。

Agent：阿里巴巴、腾讯控股、金山办公、美图公司、金蝶国际、金桥信息、拓尔思、泛微网络、鼎捷数智、税友股份、朗新集团、用友网络、慧辰股份、宇信科技、京北方、中科金财、麦迪科技、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、海天瑞声、创业黑马、迈富时、小商品城、金证股份、顶点软件、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。

自动驾驶：江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等

军工AI：能科科技、品高股份、普天科技、海格通信等。

风险提示：技术迭代不及预期风险；经济下行超预期风险；行业竞争加剧风险。

报告正文

马斯克旗下xAI发布Grok 4，大模型能力前沿持续推进

马斯克旗下xAI发布Grok 4，是Grok系列模型的最新版本。Grok4是由埃隆·马斯克的AI公司xAI开发的大型语言模型的最新版本。它于2025年7月9日正式发布，并通过xAI的官方X账号在太平洋时间晚上8点进行了直播活动。以罗伯特·A·海因莱因在《异乡人》中的概念命名，Grok4代表了显著的进步，跳过了先前预期的Grok3.5版本，以适应在激烈的AI竞争中的加速发展。

图表1：Grok 4模型发布

资料来源：grok 4官网，国盛证券研究所

从功能上而言，Grok4与前代模型的改进与差别主要如下：

lGrok4代码版：一种专门的"Grok4代码"变体，提供智能代码补全、调试辅助和优化建议，使其成为一个强大的编码伙伴，并具有实时IDE集成功能。

l多模态支持：与之前版本不同，Grok4支持多种输入类型，如文本、图像，甚至可能是视频，使其更接近GPT-4o和Gemini1.5等竞争对手。

l第一性原理推理：增强的自然语言理解，专注于第一性原理推理，并使用高级逻辑一致性来处理复杂的数学和科学查询。

图表2：Grok 4的功能特征

资料来源：grok 4官网，国盛证券研究所

与竞争者相比，Grok 4在推理能力基准测试中拥有更优表现，拥有更长的上下文窗口、以及更高的参数效率。根据官方对比数据可知，Grok4模型在推理能力Benchmark测试中获得了35%-45%的更优表现。Grok4模型参数量约为1000-1750亿，小于GPT4，根据柱状图信息显示，相比GPT4和Claude3.7，Grok4拥有更高的参数效率以及更长的上下文窗口。

图表3：Grok 4与竞争者的性能对比

资料来源：grok 4官网，国盛证券研究所

l智能：与平均水平相比，Grok4的质量更高，MMLU得分为0.866，智能指数在各项评估中为73。

l价格：Grok4的价格比平均水平高，每1M个Token的价格为6.00美元（混合3:1）。

Grok4输入Token价格：$3.00，输出Token价格：$15.00/1M个Token。

l速度：Grok4的速度比平均水平慢，输出速度为每秒74.7个Token。

l延迟：与平均水平相比，Grok4的延迟更高，接收第一个token（TTFT）需要6.41秒。

我们认为，Grok 4的发布彰显了xAI模型能力的持续提升，以及大语言模型能力前沿的持续推进。伴随着xAI未来的模型发布计划，AI产业落地有望进一步推进。

Scaling Law延续，算力依旧为大模型进步基石

据经济观察网，Grok 4的训练是在一个拥有超过20万张H100 GPU的超级计算机集群上完成的，是Grok 3时期的两倍。更重要的是，xAI改变了训练策略，将更多的算力投入到“推理能力”的专项训练上。相比于Grok 2，Grok 4的训练量提升了整整100倍。此前在2024年6月，xAI宣布在美国田纳西州孟菲斯建造超级计算机以训练其人工智能大模型Grok。该系统初期配备20万个英伟达GPU，马斯克计划将GPU规模最终扩大到100万个，而xAI计划今年8月推出代码模型，9月上线多模态智能代理，10月发布视频生成模型。xAI官方表示将继续将强化学习扩展到前所未有的水平，以Grok 4的进步为基础，突破AI智能的界限。xAI计划将范围从受控域中的可验证奖励扩展到解决复杂的现实世界问题，其中模型可以在动态环境中学习和适应。多模态功能将不断改进，集成视觉、音频等功能，以实现更直观的交互。xAI的重点仍然是使模型更智能、更快、更高效，推动系统真正理解和以深刻的方式帮助人类。我们认为，Grok4的能力提升表明了Scaling Law依然有效，扩大训练算力对模型能力的提升依然起到至关重要作用。

Agent成为AI新增长引擎，三大要素：数据、模型、接口据

随着AI技术的不断迭代，Agent已成为AI产业全新的增长引擎，不同于简单的聊天机器人，Agent能够自主理解复杂目标、拆解任务、调用工具并执行多步骤流程，驱动各行业加速对AI的采用，助推大模型的用量进入新一轮增长。我们认为Agent的三大核心要素包括数据、模型和接口。

图表4：用户调用Agent完成任务的过程

资料来源：国盛证券研究所

1、垂类数据是Agent能力拓展到各行业的关键:

当Agent发展进入深耕各行业阶段，垂类数据成为提升Agent性能的核心要素。例如飞猪的Agent“问一问”之所以能解决传统旅游AI的幻觉与时效性痛点，关键在于开放协议接口+实时数据+多智能体协作。飞猪技术负责人倪生华在硅星人pro的采访中表示，“问一问”的训练思路是，让模型学会旅游服务的思考方式后，通过飞猪自有的协议接口和Agent去调用各个场景中的实时数据。

与上一代旅行AI产品依赖静态数据库不同，飞猪直接接入了自己的机票报价引擎，Agent在解析完消费需求后，会通过报价引擎从航司和全球机票分销系统（GDS）获取信息，并打通了酒店、景区品类的供应链管理系统，确保机票、酒店价格和库存等信息秒级更新。比如当用户查询“5月北京至南京低价机票”时，系统会实时拉取航空公司的动态报价，并自动过滤已售罄的航班，保证推荐的真实有效性。更为关键的是，平台积累的用户评价数据被深度整合进推荐算法，当某酒店的过往消费者负向反馈较为明显时，AI会自动降低其推荐优先级。这种数据闭环确保了推荐方案既具备时效性，又能真实反映消费体验质量，有望从根本上解决了单纯依赖大模型预训练形成的能力、信息滞后的痛点。

其次，相比于单一模型或单智能体的决策，“问一问”采用了多智能体协作机制打造核心决策层。系统内置了行程助手、交通顾问、酒店管家等多个专业AI角色，每个角色负责特定领域的专业判断。比如当用户提出“带老人出游”的综合需求时，行程助手会智能拆解出“减少步行距离”、“避开陡坡景点”等具体任务指标，并触发交通顾问查询接驳时间宽松的航班，同时酒店管家筛选无障碍设施齐全的住宿选项。技术团队数据显示，这种分工协作模式虽然比单一模型响应速度稍慢，但方案准确性和可用性得到了大幅度提高，初步解决了旅游规划中的复杂多维决策问题。2、基础大模型的能力提升是Agent进步的核心动力：首先更强大的基础模型使Agent能够处理更复杂的多步骤任务规划，其次模型更强的上下文理解能力使Agent的工具使用能力提升，在模型能操作多个工具的时候Agent需要能准确识别任务需求与工具功能的匹配关系。4月29日阿里开源Qwen3混合推理模型矩阵，亮点包括多种思考模式&多语言&Agent能力强化。1）Qwen3有思考模式和非思考模式，思考模式下模型会逐步推理，经过深思熟虑后给出最终答案；非思考模式下，模型提供快速、近乎即时的响应。2）Qwen3模型支持119种语言和方言。3）Qwen3优化了Qwen3模型的Agent和代码能力，同时也加强了对MCP的支持。Qwen3 Dense基础模型的整体性能与参数更多的Qwen2.5基础模型相当Qwen3 MoE基础模型，在仅使用10%激活参数的情况下达到了与Qwen2.5 Dense基础模型相似的性能Agent需要通过各类接口与外部系统交互，获取上下文或执行操作，也即使用工具扩展Agent能力。例如在智能办公领域，腾讯元宝和腾讯文档在3月13日正式打通，用户可以直接上传腾讯文档到腾讯元宝，让AI辅助总结、提炼要点，也能一键导出腾讯元宝对话到腾讯文档，随时修改、分享或继续创作。

MCP协议的普及进一步降低模型打通各数据源和工具接口的开发成本。Anthropic在2024年11月25日正式开源MCP协议，旨在标准化如何为大模型提供上下文。可以将MCP想象成AI Agent的USB-C接口:为大模型提供了一种连接到各种工具和数据源的统一方法。传统上将AI统连接到外部工具涉及集成多个API，每个集成都意味着单独的代码、文档、身份验证方法、错误处理和维护。MCP旨在替换碎片化的Agent代码集成，从而使AI系统更可靠，更有效。通过建立通用标准，服务商可以基于协议来推出它们自己服务的AI能力，从而支持开发者更快的构建更强大的AI应用。开发者也不需要重复造轮子，通过开源项目可以建立强大的AI Agent生态。

图表5：MCP架构示意图

资料来源：Claudemcp官网，国盛证券研究所

投资建议

建议关注：

算力：寒武纪、海光信息、阿里巴巴、协创数据、有方科技、奥飞数据、沪电股份、新易盛、东阳光、胜宏科技、中际旭创、东山精密、伟仕佳杰、云赛智联、潍柴重机、科华数据、禾盛新材、浙数文化、大位科技、玉柴国际、亿田智能、宏景科技、弘信电子、圣阳股份、利通电子、润建股份、深信服、神州数码、深桑达、品高股份、金山云、南都电源、云天励飞、优刻得、云从科技、浪潮信息、中科曙光、太极股份、首都在线、杭钢股份、数据港、南兴股份。

Agent：阿里巴巴、腾讯控股、金山办公、美图公司、金蝶国际、金桥信息、拓尔思、泛微网络、鼎捷数智、税友股份、朗新集团、用友网络、慧辰股份、宇信科技、京北方、中科金财、麦迪科技、致远互联、汉得信息、软通动力、光云科技、上海钢联、新致软件、同花顺、信雅达、萤石网络、润达医疗、中科金财、恒生电子、星环科技、卫宁健康、创业慧康、科大讯飞、万兴科技、海天瑞声、创业黑马、迈富时、小商品城、金证股份、顶点软件、晶泰控股、佳发教育、嘉和美康、新大陆、新开普等。

自动驾驶：江淮汽车、赛力斯、小鹏汽车、理想汽车、禾赛、地平线、世运电路等

军工AI：能科科技、品高股份、普天科技、海格通信等。

风险提示

AI技术迭代不及预期风险：若技术迭代不及预期，则对产业链相关公司会造成一定不利影响。

经济下行超预期风险：若宏观经济景气度下行，固定资产投资额放缓，影响企业再投资意愿，从而影响消费者消费意愿和产业链生产意愿，对整个行业将会造成不利影响。

行业竞争加剧风险：若相关企业加快技术迭代和应用布局，整体行业竞争程度加剧，将会对目前行业内企业的增长产生威胁。

具体分析详见2025年7月12日发布的报告《Grok4发布，Scaling Law延续》

分析师刘高畅分析师执业编号S0680518090001

分析师陈泽青分析师执业编号S0680523100001

特别声明：《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者，为保证服务质量、控制投资风险，请取消关注，请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限，若给您造成不便，烦请谅解！感谢您给予的理解和配合。

重要声明：本订阅号是国盛证券计算机团队设立的。本订阅号不是国盛计算机团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构，仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读，若因对报告的摘编而产生歧义，应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断，相关的分析意见及推测可在不发出通知的情形下做出更改，读者参考时还须及时跟踪后续最新的研究进展。

本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议，不能够等同于指导具体投资的操作性意见，普通的个人投资者若使用本资料，有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义，进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用，接收人不应单纯依靠本资料的信息而取代自身的独立判断，应自主作出投资决策并自行承担投资风险。

阅读原文

跳转微信打开

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签