2025-08-11 16:31 北京
当前 AI Agent 技术与应用同步高速迭代落地,这种双重推进使诸多应用未成熟便因新技术冲击出现成熟度逆向发展甚至商业模式被颠覆,深入了解其技术及发展状态,可有效辅助企业管理者在商业战略布局中借 AI 实现创新突破。
当前,AI Agent的相关技术与 其应用正同步处于高速迭代与落地应用的进程中。这种双重推进的态势,使得诸多应用尚未抵达成熟阶段,便因新技术的持续冲击,出现应用成熟度逆向发展甚至商业模式被彻底颠覆的情况。深入了解AI及Agent的技术及发展状态,能够更有效地辅助企业管理者在商业战略布局中,借助AI技术的应用实现创新突破。
一、关键技术与框架
关键技术发展现状
大模型、GenAI技术是AI Agent原生企业落地的基础底座和关键技术。为更全面了解AI Agent原生应用的技术及发展状态,报告基于Gartner技术成熟度曲线进行了分析。
由于GenAI的爆发,Gartner自2023年起将传统AI(人工智能)和Gen AI(生成式人工智能)拆分为两条独立的技术曲线。其中AI曲线侧重于传统行业的智能化转型和AI治理,GenAI曲线侧重于基于生成式人工智能的创新、泛用和颠覆性用例。
(一)传统AI技术曲线
Artificial Intelligence技术曲线(2023年—2024年)
从Hyper cycle for Artificial Intelligence(2024年)的技术曲线来看,目前共有29项细分技术类型,与2023年的数量基本相当。类型主要包括:AI行业应用和AI治理两类。
整体趋势来说,新技术在不断涌现,多数技术尚处于刚起步和爬升阶段;少数部分发展多年的技术,逐步趋于成熟,进入了稳步爬升周期甚至滑出了曲线关注范围;但也有个别技术,像Edge AI、Cloud AI Service由于受到了某些因素影响出现倒退趋势。
应用型技术
应用类的AI技术包括:计算机视觉、增强型智能应用、知识图谱、自动驾驶、决策智能、嵌入式AI、基础模型、GenAI、智能应用程序、Cloud AI Services、Edge AI等。由于AI技术历经了长期演进,各项技术的起步时间与发展成熟度呈现一些差异。
其中,少部分应用技术,如,计算机视觉、增强型智能应用、知识图谱、自动驾驶已经开始离开“幻灭低谷期”进入“稳步爬升期”。
GenAI、合成数据、基础模型,尽管还处于炒作高峰期,但演进速度较快,已经越过了巅峰拐点,Gartner认为它们将会在2~5年内进入主流应用。建议企业尽早采用这些技术带来显著的竞争优势,并缓解与在业务流程中使用AI模型相关的问题。
由于GenAI等新技术的介入,Cloud AI Services、Edge AI、决策智能技术的成熟度出现了不同程度的倒退。也进一步说明,在当前的时间周期内,AI技术的加速迭代和AI应用的加速落地同步,这也导致很多应用还未成熟,就会由于新技术出现,导致行业应用成熟度倒退或企业商业模式颠覆。
此外,相比2023年,具身智能(Embodied AI)、量子AI(Quantum AI)作为两项新兴技术在2024年首次被单独列出,引起了广泛关注。其中,具身智能的市场关注度在急剧上升,尽管目前处于实验与原型验证阶段,但可能会成为AI发展的下一阶段核心突破口之一,尤其在实现通用智能(AGI)路径上具有战略意义。而量子AI代表的是长期颠覆性潜力,技术尚处于实验性研发与概念验证阶段,非短期落地技术。
AI治理技术
主要包括:负责任的AI、AI TRiSM(人工智能信任、风险和安全管理)、Prompt Engineering(PE,提示工程)和主权AI。这些技术整体看,正在进入技术炒作“高峰期”,显示出由于企业和个人对AI使用的迅速扩大,在治理和安全方面的担忧日益增加。
负责任的人工智能(Responsible AI)是指在人工智能系统的设计、开发、部署和使用过程中,充分考虑伦理、社会、法律及环境影响,确保AI技术对人类和社会产生积极价值,同时规避潜在风险的理念与实践框架。其核心目标是让AI系统具备可解释性、公平性、安全性,并对其决策结果承担责任,避免技术滥用或对特定群体造成伤害。受大模型落地应用的影响,相比2023年,人们对该技术寄予了更多期望,认为其在2-5年内会得到广泛应用。
AI TRiSM框架是Gartner 于2022年提出的AI信任、风险和安全管理框架,旨在通过控制措施和信任机制,提供应对AI使用风险和自身安全风险的管理措施,帮助企业确保人工智能模型的治理、可信度、公平性、可靠性、稳健性、有效性和数据保护。从2024年的曲线来看,AI TRiSM已经攀升到了炒作周期的顶峰,目前正处于备受瞩目的关键阶段。
PE也是Gartner 2022年提出来的,主要是通过格式化或非格式化的输入使GenAI给出更符合人类期望的输出结果。目前作为人类与AI交互的一门新语言学科在快速发展。随着大语言模型智力的升级,有人预测PE或许只是AI发展初期阶段的过渡性技术,未来格式化的PE有可能会消失。
(二)GenAI技术曲线
Gen AI技术曲线(2023年—2024年)
Hyper cycle for Generative AI(2024年)技术曲线,整体来看:Gen AI还是一项较新的技术,但细分技术类别却达到了28项,共分为:大模型、AI工程工具、应用和用例、支持技术和基础设施4大类。
趋势上,GenAI领域的新技术正呈指数级涌现,技术密集度较2023年在显著增加,并且当前还有技术越过“幻灭低谷期”。但研究认为,其中70%的技术都将会在2~5年内成为主流应用。这也说明:GenAI技术正呈现集中式爆发的趋势,并且技术发展与市场渗透率几近同频。然而,这种爆发式发展也可能使应用主体面临不确定性的挑战。
第一梯队 检索增强技术(RAG)、GenAI虚拟助手、GenAI应用程序、GenAI⼯作负载加速器(GPU)是当前GenAI曲线中成熟度最高的4个类别,已经成为当前的主流应用。
第二梯队 基础模型、大语言模型、多模态技术、嵌入式模型、模型Hubs、开源LLMs、提示词工程以及AI TRiSM、虚假信息安全,将会在2~5年内快速成为主流应用。其中,基础模型、大语言模型、多模态技术属于变革型技术,企业可以优先考虑布局这些能力,同时,也要考虑应用AI信任、风险和安全管理技术缓解风险。
第三梯队 边缘GenAI、GenAI编排、专业领域GenAI模型、ModelOps(模型运营),Gartner认为这些技术距离广泛应用需要约5~10年甚至更长的发展时间。从应用的角度,这些技术多是AI转型中后期,AI原生架构优化、模型生态治理并助力产业长足发展的核心能力。特别是ModelOps、GenAI应用编排作为2024年新进入曲线的两个新兴技术,在快速发展。ModelOps侧重于所有⾼级分析、AI和决策模型的端到端治理和生命周期管理。MLOps作为ModelOps核心能力之一,会专注于ML模型的监控和治理。这对于布局Agent原生战略的企业尤为重要,建议从长远发展的视角,对这些技术给予持续关注。
AI Agent技术架构
AI Agent技术在落地过程中,国内外AI研究团队都先后提出过不同的系统框架的思想。典型的有:复旦大学NLP团队提出了“大脑、感知、行动”框架;中国人民大学提出了“分析、记忆、规划、行动”通用框架;OpenAI工程师翁丽莲提出了“LLM、记忆、规划、工具使用”架构。有研究又将这些框架又分成三模块结构和四模块结构。
总体来看,这些理念并非相互对立,都包含大模型、感知和工具调用三个基本模块,核心区别在于Agent执行逻辑上是否包含“任务规划”。
从Agent技术架构演进和发展过程来看,这些思想也是早期ReAct架构和Plan-and-Execute架构的具体体现。ReAct和Plan-and-Execute,是Agent演进过程中生成Agent向自主型Agent演进的两个基本思想框架,是Agent技术迭代的两个阶段性特征,为Agent技术实现奠定了坚实的基础。当前阶段,人们对Agent最主流的理解是“感知、规划、决策和行动”,Plan-and-Execute架构是相对主流的架构。
随着AI Agent落地应用,在ReAct和Plan-and-Execute基础上,陆续发展了Multi-Agent(多智能体协同架构)、Memory-Augmented Agent(记忆增强型)、Graph-based Agent (图式流程驱动)、平台托管型等应用架构。
AI Agent技术架构及演进
(1)ReAct架构(Reasoning and Acting,推理-行动)
最早由Google提出,是最基础的Agent架构。
特点:模型通过“思考-行动-观察”的循环完成任务;
优势:结构简单,易于实现;
局限:不支持任务规划与多Agent协作,适合轻量任务;
代表实现:OpenAI Cookbook、LangChain ReAct Agent、MiniChain。AutoGPT、CrewAI。
(2)Plan-and-Execute(规划-执行)架构
重构了执行可靠性和可控性,主要由于OpenAI、LangChain推广开来。
结构:将任务拆解为“计划阶段”和“执行阶段”两步处理,彼此解耦;
优势:提高稳定性、可追踪性,易于任务管理;
应用:适合复杂流程或长任务;
代表实现:LangChain(Structured Agent)、OpenAI GPTs+Tools、Google Gemini Agent API。
(3)Multi-Agent 架构(多智能体协同)
通过多个协同Agent(不同角色)解决复杂任务,支持分工、协商、反馈等智能体行为。典型工作流程是:任务分派→多角色Agent协作→主控Agent评估结果→整合输出。
特点:引入记忆、通信、协同协议,能模拟真实“团队合作”,适合复杂任务处理;
应用场景:适合复杂场景自动化,如软件开发、金融分析、多部门工作流;
代表框架:AutoGen(Microsoft)、CrewAI、MetaGPT、ChatDev、CAMEL。
(4) Memory-Augmented Agent架构(记忆增强型)
Agent拥有可持续更新的长期记忆系统,用于上下文关联、习惯学习、知识积累。
特点:能力越用越强,支持知识沉淀,适合构建个性化与长期互动Agent;
应用场景:个人助理、企业私教、知识管理助手;
代表实现:LangChain Memory、MemGPT、LlamaIndex Agent + Memory、Reverie Agent。
(5)Graph-based Agent架构(图式流程驱动)
以节点(任务)+边(控制流)形式构建复杂任务图,实现可视化调度与并行控制。
特点:易于调试、回溯、编排,适合构建复杂流程与DAG控制逻辑;
应用场景:企业级流程自动化、智能BI、供应链、运营任务调度;
代表框架:LangGraph、Flowise、GraphRAG、AgentVerse(阿里)。
(6)Agent-as-a-Service架构(平台托管型)
将Agent作为一个托管服务运行,支持多用户接入、权限控制、状态管理等。
特点:结合API网关、用户管理、工作流中台,具有平台化、微服务化,支持弹性部署、权限隔离等特点;
应用场景:企业SaaS服务、智能客服、RPA增强、AI原生协作工具;
代表平台:OpenAI GPTs(支持用户通过自然语言配置自定义 Agent,提供工具调用和服务分享能力)、阿里 AgentVerse(面向企业的多 Agent 协作平台,提供低代码 Agent 构建、场景化部署及生态集成服务)、百度 AgentBuilder(聚焦轻量化 Agent 开发,通过可视化界面和模板快速生成任务型 Agent,支持 API 对接)、字节 OneAgent(集成字节生态能力,提供 Agent 创建、调度及多场景适配服务,侧重企业级效率工具集成)。此外,微软 Azure AI Agent Framework(提供标准化 Agent 开发套件与云服务部署能力)、Anthropic Claude Agent(基于 Claude 大模型的 Agent 服务接口,支持自定义任务编排)等也是 AaaS 架构的重要实践平台,共同推动 Agent 能力的服务化与普惠化。
二、AI Agent应用系统框架
基础框架及组成
AI Agent应用系统作为AI Agent原生企业的核心业务系统,是驱动企业运营的命脉与战略发展的基石。其本质是基于大语言模型与Agent构建的数智化系统,通常由大模型、AI Agent应用/平台、知识系统与交互系统四个基础模块组成。
AI Agent应用系统的基本原型
(1)基础模型
大模型是AI Agent应用系统的“智能底座”和“大脑”,提供自然语言理解、知识生成、通用推理等核心智能,可以赋予Agent理解、思考和规划能力,是所有Agent智能决策的核心引擎。
(2)AI Agent应用/平台
AI Agent应用/平台是大模型行为能力的主要载体,也是企业实现智能业务流程、自动化应用、垂直智能体的技术框架。该模块将模型能力封装为标准化功能组件,并通过集成API、插件、数据库等工具链,支持多任务、多智能体协作。产品形态有:应用、平台、服务三种。
(3)知识系统
知识系统通过企业专属知识注入(私有知识库),语义搜索与上下文检索(RAG),支撑Agent的知识增强与长期记忆,弥补大模型本身无法实时更新或记忆的缺陷。通常包括结构化数据、非结构化文本、知识图谱、向量数据库等。
(4)交互系统
交互系统是用户与Agent 交互的前端模块,提供对话入口或图形界面,可接入语音、图像、视频等多模态输入,支持对话管理、多轮上下文维护及可视化展示等功能。是实现“人-机协作”的直接媒介,决定用户体验。
从信息系统四层结构来看,Agent应用系统相比传统信息系统有很大区别。
传统信息系统与AI Agent应用系统的结构对比
系统层,从硬件和操作系统为核心的服务器进化为以提供“算法+算力”为主的智能基础设施;
数据层,数据类型从结构化数据库(如MySQL、Oracle)扩展为用于模型训练与推理的非结构化/多模态大数据;
应用层,从模块化的业务流程软件进化为支持自然语言驱动、业务编排与执行能力的智能Agent应用/平台;
表示层,从传统表单、按钮式交互升级为支持多模态、人机对话、自然语言交互的用户界面。
基于Agentic AI生态的企业级框架
2025年5月,Agentico创始人Oliver Morris与变革管理专家Simon Torrance合作在AI Risk平台上提出并发布了“Agentic AI Stack for Enterprises”企业级框架。
该框架从企业运营角度映射到Agentic AI生态系统,旨在为企业提供一个战略视角理解Agentic AI生态系统的方式。自下而上分为:数据层、能力层、交互层三大层级,分别从技术与运营管理两个维度,明确了企业从传统系统向Agent驱动架构演进的路径。可以帮助企业以战略思维和可控方式,从底层到前端系统性地向“Agent 原生”演进。
Agentic AI Stack for Enterprises
(1)数据层(Data Tier)
数据层聚焦于底层数据基础与治理,构成Agentic AI系统的知识根基。核心价值确保所有智能体的输入输出有据可查,实现学习可验证与审计追踪。
功能包括:构建结构化和非结构化的数据存储系统(数据库、数据湖、知识图谱、向量存储),管理数据质量、审计与合规性,提供用于Agent训练、推理和自我审查的数据流水线。
(2)能力层(Capabilities Tier)
能力层是构建企业级Agent系统的“智能中枢”,由Controls、Orchestration、Intelligence、Tools四个子模块构成。
Controls(控制模块),主要负责Agent运行的身份、安全、合规与策略管理,确保系统可信、合规、可控。
Orchestration(编排模块),定义多Agent、任务、工作流的管理与调度,是连接输入、模型与执行之间的协调器。
Intelligence(智能模块),为Agent提供真正的“智能能力”,即大语言模型、计算能力和自学习机制。
Tools(工具模块),提供Agent执行任务所调用的“技能插件”——即具体可执行工具或 API。
(3)交互层(Engagement Tier)
交互层是AI Agent与人或系统交互的前端界面,是“感知与呈现”的窗口。包括Interfaces和Third-party Agents两个组成部分。核心价值是让Agent能够跨平台被发现、组合、执行与授权,是Agent服务化的入口。
Interfaces:对用户及系统的接口。如,聊天、表单、API、IoT。
Third-party Agents:支持 Agent之间协作调用与互信授权。
合作电话:18311333376
合作微信:aqniu001
投稿邮箱:editor@aqniu.com