囊括1400+论文！大语言模型上下文工程全面综述：框架、系统与挑战

PaperWeekly 18小时前

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

本文详细解读了中科院计算技术研究所主导的“大模型上下文工程”综述论文，提出了一种将上下文工程分解为基础组件和系统实现的分类框架。文章形式化定义了上下文工程，并将其核心技术领域细分为检索与生成、处理和管理三大基础组件。同时，综述还深入探讨了检索增强生成（RAG）、记忆系统、工具集成推理以及多智能体系统等四种关键的系统实现方式。研究旨在为未来的上下文感知智能体系统提供理论基础与系统蓝图，并指出了理解与生成能力之间的差距以及未来的研究方向和机遇。

💡 上下文工程被形式化定义为优化供给大语言模型（LLMs）的信息有效载荷，旨在超越传统提示工程，构建一个由指令、外部知识、工具定义、历史交互、动态状态和用户请求等多个信息组件构成的结构化集合，并通过一系列函数进行获取、过滤、格式化和编排，以最大化 LLM 输出质量。

📚 基础组件是上下文工程的基石，分为三个关键阶段：上下文检索与生成（包括提示工程、外部知识检索如RAG、动态上下文组装）；上下文处理（涉及长上下文处理、上下文自精炼与适应、多模态及结构化上下文整合）；以及上下文管理（应对上下文窗口限制、设计记忆层次与存储架构、进行上下文压缩）。

🚀 系统实现是上下文工程的落地应用，包括检索增强生成（RAG）的模块化、智能体化和图增强；记忆系统实现信息的持久化存储与利用，分为短期和长期记忆；工具集成推理使LLMs能通过函数调用利用外部工具；以及多智能体系统通过协作解决复杂问题。

🎯 研究的核心目标是弥合LLMs在理解复杂上下文与生成同等复杂长篇输出之间的差距。未来的研究方向包括建立统一的理论基础、探索新一代架构、发展高级推理与规划能力，以及解决在生产部署中的可扩展性、安全性和伦理问题。

原创让你更懂AI的 2025-07-24 21:36 北京

一次读懂「大模型上下文工程」全貌

本工作由中科院计算技术研究所团队主导完成，旨在为未来的上下文感知智能体系统提供清晰的理论基础与系统蓝图。

论文标题：

A Survey of Context Engineering for Large Language Models

论文全文：

https://arxiv.org/abs/2507.13334

配套资源库：

https://github.com/Meirtz/Awesome-Context-Engineering

Hugging Face 页面：

https://huggingface.co/papers/2507.13334

Motivation与背景

大型语言模型（LLMs）的性能从根本上取决于其在推理过程中获得的上下文信息。随着 LLMs 从简单的指令遵循系统发展为复杂应用的推理核心，如何设计和管理其信息有效载荷已演变为一门正式的学科。

传统的“提示工程”（Prompt Engineering）概念已不足以涵盖现代AI系统所需的信息设计、管理和优化的全部范围。这些系统处理的不再是单一、静态的文本字符串，而是一个动态、结构化且多方面的信息流。

上下文工程（Context Engineering）的出现，旨在超越简单的提示设计，系统性地优化供给 LLMs 的信息有效载荷。

然而，上下文工程领域的研究虽然发展迅速，却呈现出高度专业化和碎片化的特点。现有研究大多孤立地探讨特定技术，如检索增强生成（RAG）、智能体系统（Intelligent Agent Systems）或长上下文处理等，缺乏一个统一的框架来系统地组织这些多样化的技术，阐明其内在联系。

为了应对这一挑战，本篇综述对超过 1400 篇研究论文进行了系统性分析，首次对 LLMs 的上下文工程进行了全面和系统的回顾，旨在为研究人员和工程师提供一个清晰的技术路线图，促进对该领域的深入理解，催化技术创新。

论文内容详解

本综述的核心贡献是提出了一个将上下文工程分解为基础组件（Foundational Components）和系统实现（System Implementations）的分类框架。

2.1 上下文工程的定义与形式化

我们首先对上下文工程进行形式化定义。对于一个自回归的 LLM，其模型参数为 θ，在给定上下文 C 的条件下，生成输出序列的过程可以表示为最大化条件概率：

传统提示工程将上下文 C 视为一个单一的文本字符串，即 C=prompt。上下文工程则将 C 重新概念化为一个由多个信息组件动态构成的结构化集合。

这些组件由一系列函数进行获取、过滤和格式化，并最终由一个高阶的组装函数 A 进行编排：

这些组件对应了本综述的核心技术领域：

：系统指令和规则。

：通过 RAG 等功能检索到的外部知识。

：可用外部工具的定义和签名。

：来自先前交互的持久化信息。

：用户、世界或多智能体系统的动态状态。

：用户的即时请求。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签