刘高畅/李可夫 2025-02-09 15:23 日本
最全近期AI重点梳理
风险提示:
2月7日,微软CEO纳德拉宣布GitHub Copilot正all -in到智能体,并推出自主的SWE agent
图表1:纳德拉宣布GitHub Copilot正all -in到智能体 |
资料来源:X,国盛证券研究所 |
据GitHub官网,GitHub Copilot 的Agent模式已经推出预览版。新Agent模式能够迭代自己的代码,识别错误并自动修复。它可以建议终端命令并要求执行。它还可以分析运行时错误并具有自我修复功能。在Agent模式下,Copilot 不仅会迭代自己的输出,还会迭代该输出的结果。它会一直迭代,直到完成完成提示所需的所有子任务。Copilot现在不仅可以执行用户请求的任务,还可以推断未指定但对主要请求工作也必不可少的其他任务。更棒的是,它可以捕获自己的错误,用户无需从终端复制/粘贴回聊天。Agent模式将改变开发人员在编辑器中的工作方式。
图表2:VS Code中的Agent模式设置 |
资料来源:GitHub,国盛证券研究所 |
SWE Agent是GitHub首次介绍的一种 AI 驱动或自动化系统,用于协助(或代表)软件工程师。它们可以执行各种开发任务,例如生成和审查代码、重构或优化代码库、自动化测试或管道等工作流程,以及提供架构、错误故障排除和最佳实践方面的指导。它们旨在减轻软件工程师的一些常规或专门任务,让他们有更多时间专注于更有价值的工作。
以代号 Project Padawan 构建的SWE Agent产品于今年晚些时候发布,它将允许用户使用任何 GitHub 客户端直接将问题分配给 GitHub Copilot,并让它生成经过全面测试的拉取请求。任务完成后,Copilot 将为 PR 分配人工审阅者,并努力解决他们添加的反馈。从某种意义上说,这就像让 Copilot 成为 GitHub 上每个存储库的贡献者一样.
图表3:GitHub上的SWE Agents演示 |
资料来源:GitHub,国盛证券研究所 |
我们认为,编程问题有比较准确、快迭代的评判标准,同时类似Github等社区拥有海量高质量代码数据,是大模型能较快取得进步的方向。随着底层模型能力的持续提升以及在AI编程工具在交互界面等方向的产品化持续推进,AI编程的应用速度将大幅加快。我们预计2025年下半年起,AI编程会产生显著商业化效果,由于计算机行业人员成本是重要的成本组成部分,AI编程有望给计算机行业公司整体利润率带来极大的提升空间。
2025年1月20日,DeepSeek开源DeepSeek-R1模型,在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版。同时DeepSeek通过 DeepSeek-R1 的输出,蒸馏了6个小模型开源给社区,其中 32B 和 70B 模型在多项能力上实现了对标 OpenAI o1-mini的效果。同时DeepSeek-R1API服务定价远低于OpenAI o1。
图表4:DeepSeek-R1在多项评测基准上得分 |
资料来源:DeepSeek,国盛证券研究所 |
图表5:DeepSeek蒸馏得到的小模型在多项能力得分优秀 |
资料来源:DeepSeek,国盛证券研究所 |
字节豆包实时语音大模型发布,情绪理解与表达能力突出。1)1月20日豆包实时语音大模型在豆包 APP 全量开放,在情绪理解和情感表达方面与GPT-4O相比优势明显。豆包团队围绕拟人度、有用性、情商、通话稳定性、对话流畅度等多个维度进行考评。整体满意度(以 5 分为满分)方面,豆包实时语音大模型评分为 4.36,GPT-4o 为 3.18。其中,50% 的测试者对豆包实时语音大模型表现打出满分。在模型优点评测中豆包实时语音大模型在情绪理解和情感表达方面与GPT-4O相比优势明显。尤其是“一听就是 AI 与否”评测中,超过 30% 的反馈表示 GPT-4o “过于 AI ”,而豆包实时语音大模型相应比例仅为 2% 以内。
图表6:豆包团队模型评测满意度分值分布 |
资料来源:豆包大模型团队,国盛证券研究所 |
1月22日,豆包全新基础模型Doubao-1.5-pro 正式发布,基础模型能力全面提升。Doubao-1.5-pro 使用稀疏 MoE 架构,在预训练阶段,仅用较小参数激活的 MoE 模型,性能即可超过Llama3.1-405B 等超大稠密预训练模型。团队通过对稀疏度Scaling Law 的研究,确定了性能和效率比较平衡的稀疏比例,并根据 MoEScaling Law 确定了小参数量激活的模型即可达到世界一流模型的性能。
MoE 模型的性能通常可以用表现相同的稠密模型的总参数量和 MoE 模型的激活参数量的比值来确定,此前业界在这一性能杠杆上的普遍水平为不到 3 倍。豆包团队通过模型结构和训练算法优化,在完全相同的部分训练数据(9Ttokens)对比验证下,用激活参数仅为稠密模型参数量 1/7 的 MoE 模型,超过了稠密模型的性能,将性能杠杆提升至 7 倍。
阿里通义千问登顶非推理国产模型冠军。Qwen2.5-Max于1月29日发布,2月4日凌晨,ChatbotArena 公布了最新的大模型盲测榜单,通义千问Qwen2.5-Max凭借1332分的成绩,位列全球第七,并成为非推理类中国大模型的冠军。同时,Qwen2.5-Max在数学和编程等单项能力上排名第一,在硬提示(Hardprompts)方面排名第二。
Qwen2.5-Max是超大规模的 MoE 模型,使用超过 20 万亿token 的预训练数据及精心设计的后训练方案进行训练。持续提升数据规模和模型参数规模能够有效提升模型的智能水平。接下来Qwen团队除了在预训练的scaling 继续探索外,将大力投入强化学习的scaling,希望能实现超越人类的智能。我们认为国内一流非推理模型的进展有助于推理模型的能力进一步强化。
图表7:Qwen2.5-Max 位列Chatbot Arena榜单全球第七 |
资料来源:通义千问,国盛证券研究所 |
近期字节、deepseek,阿里等厂商竞相发布模型新进展。我们认为大模型厂商之间的良性竞争,有利于应用加速落地。尤其目前国内公司进展迅速,有望打开以互联网大厂为核心的AI生态投资机遇。
据AI产品榜,DeepSeek APP上线20天日活突破两千万,成为全球增速最快AI应用。豆包1月MAU为7861万,同比增长10.47%。
图表8:DeepSeek上线20天日活变化 |
资料来源:AI产品榜,国盛证券研究所 |
软硬件厂商纷纷接入DeepSeek,AI应用全面加速落地。除了DeepSeek应用本身的用户快速增长,DeepSeek模型出色的性能以及低成本的特性也有利于各行业公司加速AI应用的落地进展,近期国内外众多AI应用公司、硬件厂商和云厂商都纷纷将自己的硬件与DeepSeek模型适配或者将产品接入DeepSeek能力。我们整理了国内部分已宣布适配或接入DeepSeek的公司,包括国产算力公司、云厂商、各垂类应用公司等:
图表9:部分接入DeepSeek的公司 | |
公司 | 相关细节 |
寒武纪 | 南京智算中心宣布联合国产芯片厂商寒武纪,用全国产设备运行国产大模型DeepSeek,为苏宁易购提供全国产化模型推理服务,成为南京首例全国产算力版DeepSeek案例。 |
海光信息 | 近日,海光信息技术团队成功完成DeepSeek V3和R1模型与海光DCU(深度计算单元)的适配,并正式上线用户现可通过“光合开发者社区”中的“光源”板块访问并下载相关模型,或直接登录[www.sourcefind.cn]搜索“DeepSeek”,即可基于DCU平台快速部署和使用相关模型。 |
云天励飞 | 春节期间,云天励飞芯片团队完成 DeepEdge10 “算力积木”芯片平台与DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Llama-8B大模型的适配,可以交付客户使用。DeepSeek-R1-Distill-Qwen-32B、DeepSeek-R1-Distill-Llama-70B大模型、DeepSeek V3/R1 671B MoE大模型也在有序适配中。 |
汉得信息 | 汉得AI融合平台自2023年7月推出之时,就已经明确了要具备对接主流多套大模型的能力。2024年年中就已经完成了和Deepseek-V2的对接,在2025年1月份完成了和R1版本的对接(V3版本的对接随着官网V2模型的升级,已自动对接)。 |
新致软件 | DeepSeek模型已经成功接入新致软件新知平台保险、司法、汽车等重点行业的智能机器人系统中。这意味着,无论是风险评估、法律文档审核还是智能流程等方面,这些机器人都将以更加智能、高效的方式执行任务,极大地提升了工作效率与准确性。 |
万兴科技 | 万兴科技完成深度求索(DeepSeek)最新推理大模型DeepSeek-R1的深入适配,涵盖旗下视频创意、绘图创意及文档创意软件业务多款产品。目前,万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等均已融合DeepSeek-R1大模型相关能力。 |
光云科技 | 光云科技旗下快麦小智已接入并支持DeepSeek。快麦小智是基于自然语言交互和个性化推荐技术搭建的对话式营销服务一体化智能客服机器人,专注于为电商卖家提供一体化的智能客服解决方案,帮助客服更高效作业,提升消费者购物体验。 |
梦网科技 | 梦网科技将DeepSeek大模型深度集成至多源AI调度引擎“天慧智汇台2.0”,推动消息通信服务从基础连接向智能决策升级,为行业开辟降本增效新路径。 |
神州数码 | 神州数码旗下神州鲲泰推理服务器产品搭载昇腾硬件,可全面支持DeepSeek系列模型的快速部署,为用户带来更快、更高效、更便捷的AI开发和应用体验。为进一步推动技术创新与融合,神州数码还将DeepSeek集成到其自主研发的神州问学平台中,仅需3分钟部署DeepSeek模型 |
迈富时 | Marketingforce迈富时宣布AI Agent产品全面接入DeepSeek-V3和DeepSeek-R1,将其融合至AI-Agentforce中台,为企业客户打造更具创新性与竞争力的智能化营销销售全链路解决方案。企业用户可以在T云(视频魔方),智能体商城,TTalk智能客服,ChatBI,臻文,臻图,臻视等众多产品中直接使用,提高其生产及运营效率。 |
万马科技 | 万马科技全资子公司优咔科技打造“遨云”智算解决方案,为汽车智能化提供一站式的算力及工具链支持,在优咔“遨云”大模型应用平台中,已全面开展包括R1在内的DeepSeek全系列模型适配工作,以满足不同规模参数量模型的个性化部署需求。目前可一键本地部署体验DeepSeek,近期将开放微调功能。 |
用友网络 | 用友BIP全面上线以DeepSeek-V3和DeepSeek-R1作为基座大模型的智能服务,企业客户可以通过用友BIP3 R6智能平台的公有云、专属云模式使用相关服务。 |
金蝶国际 | 已将DeepSeek全面集成至金蝶云全线SaaS应用及金蝶云苍穹平台,为客户提供更高效、更安全、更低成本的智能解决方案。 |
协创数据 | DeepSeek系列模型正式上线协创数据FCloud智能体训推创新平台。FCloud智能体训推创新平台是一款面向多个行业场景,从基础算力到 AI 产业生态链提供多级赋能的产品,包括训推融合平台(TIC)、大模型应用开发平台(ASD)、AI 算力管理与服务运营平台(AIC)。 |
创业黑马 | 黑马天启基于DeepSeek发布政策大模型1.1版。模型能力层面基于DeepSeek训练全国政策数据与行业知识,海量用户问答数据,全国1.6亿工商注册数据,4000万企业数据,3000万商标数据,超过2亿+条全国专利详细信息,形成1.1版本的政策大模型 |
拓尔思 | 凭借”平台+系统+服务”的三重优势,全面集成DeepSeek,全面提升客户的大模型使用体验和降低大模型项目的成本,大大提升了拓天行业大模型的核心竞争力。 |
彩讯股份 | 彩讯股份Rich AIBox正式接入DeepSeek-V3、DeepSeek-R1大模型,进一步提升了垂直领域大模型能力,Rich AIBox是彩讯股份推出的一站式AI应用开发平台,基于Rich AIBox,彩讯股份为企业用户提供从数据集管理、到模型训练/调优、到AI Agent智能体生成的全流程大模型解决方案。 |
软通动力 | 软通动力积极拥抱DeepSeek,率先进行产品的创新融合,通过把DeepSeek-R1接入天璇MaaS平台,以全栈AI技术服务加速企业智能化转型。 |
安恒信息 | 安恒信息旗下恒脑·安全垂域大模型正式集成DeepSeek,完成基于DeepSeek-R1的安全大模型的训练,推出首个“DeepSeek”版安全智能体,开启全新智能化安全之旅 |
亚信安全 | 亚信安全基于DeepSeek-V3/R1构建智能体,能够在海量的安全告警中,快速、低成本地挖掘到不同来源、不同类型安全告警中的关联关系,形成安全事件链,现已能够准确识别出连续HTTP弱口令登录、多模式网络扫描、网络挖矿、恶意社攻等10余种复杂安全事件。 |
360 | 近期,火爆全球的DeepSeek线上服务受到大规模恶意攻击,多次出现网页和API服务中断,甚至一度无法注册。360持续跟进关注,并在第一时间宣布为DeepSeek免费提供全方位网络安全防护。 |
天融信 | 天融信天问大模型正式完成DeepSeek大模型的接入,赋能安全事件检测分析、威胁情报融合等多个场景,进一步提升了天融信现有的安全产品和服务能力。 |
青云科技 | 青云科技旗下 AI 算力云服务——基石智算CoresHub已经部署并上线了 DeepSeek 全系列大模型供用户选择使用 |
优刻得 | 优刻得基于壁仞科技国产芯片的先进内存架构、多模型适配能力、广泛的数据精度支持以及解码能力,全面开展包括R1在内的DeepSeek全系列模型适配工作。 |
资料来源:各公司公众号,中国基金报,360企业安全,江宁发布,国盛证券研究所 |
建议关注:
AI技术迭代不及预期风险:若AI技术迭代不及预期,则对产业链相关公司会造成一定不利影响。
经济下行超预期风险:若宏观经济景气度下行,固定资产投资额放缓,影响企业再投资意愿,从而影响消费者消费意愿和产业链生产意愿,对整个行业将会造成不利影响。
行业竞争加剧风险:若相关企业加快技术迭代和应用布局,整体行业竞争程度加剧,将会对目前行业内企业的增长产生威胁。
具体分析详见2025年2月9日发布的报告《模型&算力&应用进展不断》
分析师 刘高畅 分析师执业编号S0680518090001
特别声明:《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过微信形式制作的本资料仅面向国盛证券客户中的专业投资者。请勿对本资料进行任何形式的转发。若您非国盛证券客户中的专业投资者,为保证服务质量、控制投资风险,请取消关注,请勿订阅、接受或使用本资料中的任何信息。因本订阅号难以设置访问权限,若给您造成不便,烦请谅解!感谢您给予的理解和配合。
重要声明:本订阅号是国盛证券计算机团队设立的。本订阅号不是国盛计算机团队研究报告的发布平台。本订阅号所载的信息仅面向专业投资机构,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自国盛证券研究所已经发布的研究报告或者系对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。本资料仅代表报告发布当日的判断,相关的分析意见及推测可在不发出通知的情形下做出更改,读者参考时还须及时跟踪后续最新的研究进展。
本资料不构成对具体证券在具体价位、具体时点、具体市场表现的判断或投资建议,不能够等同于指导具体投资的操作性意见,普通的个人投资者若使用本资料,有可能会因缺乏解读服务而对报告中的关键假设、评级、目标价等内容产生理解上的歧义,进而造成投资损失。因此个人投资者还须寻求专业投资顾问的指导。本资料仅供参考之用,接收人不应单纯依靠本资料的信息而取代自身的独立判断,应自主作出投资决策并自行承担投资风险。
版权所有,未经许可禁止转载或传播。