PaperAgent 01月01日
2025,AI Agents技术栈解读出炉!
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文深入探讨了AI Agent技术栈的构成,指出其与传统LLM栈的显著差异。文章将Agent技术栈分为三个关键层:Agent托管/服务、Agent框架以及LLM模型和存储。详细分析了每个层面的关键技术和发展趋势,包括模型推理服务、向量数据库在Agent记忆中的应用、工具执行的安全性、Agent框架的状态管理和上下文窗口结构,以及多Agent通信。文章强调Agent技术栈仍处于早期阶段,未来将向服务化方向发展,同时指出部署Agent服务比部署LLM服务更为复杂,需要解决状态管理和工具执行安全等问题。文章最后展望了Agent技术栈的未来发展,并指出了生态系统扩展和演变的可能性。

🧰Agent技术栈由三个关键层构成:Agent托管/服务、Agent框架以及LLM模型和存储。其中,模型服务层是核心,它依赖于LLM和推理引擎,如OpenAI、Anthropic等提供的API服务,以及vLLM和Ollama等本地模型推理工具。

🧠存储层对于有状态的Agent至关重要。向量数据库如Chroma、Weaviate等被广泛用于存储Agent的外部记忆,以便Agent利用数据源和对话历史。传统的Postgres数据库也通过pgvector扩展支持向量搜索,为Agent提供存储解决方案。

🛠️工具和库是区分Agent与标准AI聊天机器人的关键。Agent能够调用工具执行特定功能,通常通过LLM生成JSON对象来实现。工具执行的安全性至关重要,需要使用沙箱如Modal、E2B确保安全。工具生态系统不断增长,提供通用工具如Composio和专用工具如Browserbase。

⚙️Agent框架负责协调LLM调用并管理Agent状态。不同的框架在状态管理、上下文窗口结构、跨Agent通信和内存方法方面有所不同。框架的选择取决于应用场景,如会话Agent或工作流程,以及对开放权重模型的支持。Letta Agent自动配备了一套内存管理工具。

☁️Agent托管和Agent服务代表了未来的发展方向。将Agent视为服务部署到本地或云基础设施上,并通过REST API访问是未来的趋势。这需要解决状态管理和安全工具执行的问题,目前大多数Agent框架仍处于脚本或笔记本阶段。

2025-01-01 00:03 湖北

2025新年伊始,今年将是“Agentic系统之年”,“2025将会出现真正Agent,时不我待,请签收属于你的AI Agents技术栈综述

理解AI Agents生态

尽管我们看到了大量关于Agent栈和市场的分类图,但我们往往不同意它们的分类方式,发现它们很少反映开发者实际使用的。在过去几个月中,随着在内存、工具使用、安全执行和部署方面的进步,Agent软件生态系统有了显著的发展,因此,能够真正落地的“Agent技术栈(agent stack”应该是怎样尼?

AI Agents技术栈,被组织成三个关键层:Agent托管/服务、Agent框架,以及LLM模型和存储。

从LLM到LLM Agent

在2022年和2023年,我们看到了LLM框架和SDK的兴起,比如LangChain(2022年10月发布)和LlamaIndex(2022年11月发布)。同时,我们也看到了几个“标准”平台的建立,这些平台通过API消费LLMs以及自部署LLM推理(vLLM和Ollama)。

在2024年,我们看到了对AI“Agent”的兴趣急剧转变,更广泛地说,是对复合系统的兴趣。尽管“Agent”这个术语在AI中已经存在了几十年(特别是在强化学习中),但在后ChatGPT时代,“Agent”已经成为一个松散定义的术语,通常指的是被赋予输出动作(工具调用)并在自治设置中运行的LLM。从LLM到Agent所需的工具使用、自治执行和内存的结合,促使一个新的Agent栈发展。

Agent技术栈的独特之处

与基本的LLM聊天机器人相比,Agent是一个更复杂的工程挑战,因为它们需要状态管理(保留消息/事件历史记录,存储长期记忆,执行多个LLM调用在一个Agent循环中)和工具执行(安全执行LLM输出的动作并返回结果)。

因此,AI Agent栈与标准的LLM栈看起来非常不同。让我们从模型服务层开始,分解今天的AI Agent栈:

模型服务

AI Agent的核心是LLM。要使用LLM,模型需要通过推理引擎提供服务,通常运行在付费API服务后面。

OpenAI和Anthropic在基于封闭API的模型推理提供商中领先,拥有私有前沿模型。Together.AI、Fireworks和Groq是提供开放权重模型(例如Llama 3)背后的付费API的流行选项。在本地模型推理提供商中,我们最常见到vLLM领先于生产级GPU基础服务负载。SGLang是一个新兴项目,拥有类似的开发者受众。在业余爱好者(“AI爱好者”)中,Ollama和LM Studio是两个流行的选项,用于在您自己的计算机上运行模型(例如M系列Apple Macbooks)。

存储

存储是定义为有状态的Agent的基本构建块——Agent由持久状态定义,如他们的对话历史记录、记忆和外部数据源,他们用于RAG。像Chroma、Weaviate、Pinecone、Qdrant和Milvus这样的向量数据库很受欢迎,用于存储Agent的“外部记忆”,允许Agent利用数据源和对话历史记录,这些数据太大,无法放入上下文窗口。Postgres是一个自80年代以来就存在的传统数据库,现在也通过pgvector扩展支持向量搜索。基于Postgres的公司如Neon(无服务器Postgres)和Supabase也为Agent提供基于嵌入的搜索和存储。

工具和库

标准AI聊天机器人和AI Agent之间的一个主要区别是Agent调用“工具”(或“功能”)的能力。在大多数情况下,这种动作的机制是LLM生成结构化输出(例如JSON对象),指定要调用的函数和提供的参数。Agent工具执行的一个常见混淆点是,工具执行_不是_由LLM提供商本身完成的——LLM只选择要调用的工具和提供的参数。支持任意工具或任意参数输入工具的Agent服务必须使用沙箱(例如Modal、E2B)以确保安全执行。

Agent通过OpenAI定义的JSON模式调用工具——这意味着Agent和工具实际上可以跨不同框架兼容。Letta Agent可以调用LangChain、CrewAI和Composio工具,因为它们都是由相同的模式定义的。因此,对于常见工具,有一个不断增长的工具提供商生态系统。Composio是一个流行的通用工具库,还管理授权。Browserbase是一个专门用于网页浏览的专用工具的例子,Exa提供了一个专门用于搜索网络的专用工具。随着越来越多的Agent被构建,我们预计工具生态系统将增长,并提供现有新功能,如Agent的身份验证和访问控制。

Agent框架

Agent框架协调LLM调用并管理Agent状态。不同的框架将为以下方面有不同的设计:

在今天构建Agent时,正确的框架选择取决于您的应用程序,例如您是否正在构建会话Agent或工作流程,您是否希望在笔记本或作为服务运行Agent,以及您对开放权重模型支持的要求。

我们预计框架之间的主要区别将出现在它们的部署工作流程中,状态/内存管理和工具执行的设计选择变得更加重要。

Agent托管和Agent服务

今天的大多数Agent框架都是为那些不存在于它们编写的Python脚本或Jupyter笔记本之外的Agent设计的。我们相信Agent的未来是将Agent视为一个_服务_,该服务被部署到本地或云基础设施上,可以通过REST API访问。就像OpenAI的ChatCompletion API成为与LLM服务交互的行业标准一样,我们预计最终会有一个赢家为Agent API。但还没有一个……。

部署Agent作为服务比部署LLM作为服务要复杂得多,因为状态管理和安全工具执行的问题。工具及其所需的依赖项和环境需求需要明确存储在数据库中,因为运行它们的环境需要由服务重新创建(这不是一个问题,当您的工具和Agent在同一个脚本中运行时)。应用程序可能需要运行数百万Agent,每个Agent都累积了越来越多的对话历史记录。当从原型转移到生产时,Agent状态不可避免地必须经历一个数据规范化过程,Agent交互必须由REST API定义。今天,这个过程通常是通过开发者编写自己的FastAPI和数据库代码来完成的,但我们预计随着Agent的成熟,这个功能将更多地嵌入到框架中。

结论

Agent技术栈仍然非常早期,我们对生态系统如何扩展和演变感到兴奋。对未来Agent技术栈发展你还有什么补充吗?

https://www.letta.com/blog/ai-agents-stack

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

AI Agents 技术栈 LLM Agent框架 模型服务
相关文章