PaperAgent 07月08日 13:59
传统搜索的终章?信息检索正走向“Agentic Deep Research”新时代
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

本文深入探讨了从传统网页搜索向基于AI的深度研究范式的转变。随着苹果等公司推出系统级AI助手,并整合ChatGPT进行摘要生成,传统搜索引擎的市场份额正面临挑战。文章分析了Deep Research Agent的崛起,这些Agent能够主动调研、分析、整合信息并给出结论。研究重点介绍了伊利诺伊大学等机构的研究成果,包括推理-检索协同和强化学习代理。文章还讨论了Deep Research Agent的核心技术、评估标准以及未来发展方向,如可信的Human-in-loop系统、垂直领域的专家级深研、结构化-组织型深研系统以及多模态信息融合。最后,文章展望了高效的Test-Time Scaling和资源自管理,为下一代Agentic Deep Research提供了关键思考。

🔍 **范式转变的驱动力:** 传统搜索模式正面临变革,用户需求已从简单的关键词搜索转向AI驱动的主动研究。Deep Research Agent应运而生,能够完成多步研究任务,整合信息并给出结论。

💡 **核心技术与模型:** Deep Research Agent依赖于三大技术支柱:基于推理的LLM、学习“搜索”的LLM代理以及DeepResearcher。DeepSeek-R1和OpenAI O1等模型通过微调和强化学习提升推理、任务分解和自省能力。

📊 **评估与基准:** 为了评估Deep Research Agent的实用价值,研究引入了BrowseComp、BrowseComp-ZH和HLE等高难度评测基准。OpenAI Deep Research Agent在这些任务中表现优于传统LLM,展现出强大的研究能力。

⚖️ **Test-Time Scaling Law:** 论文提出了TTS Law,即推理深度和检索轮次在给定token预算内存在线性增益与权衡。这为系统设计提供了“预算分配指南”,帮助在性能与成本之间取得平衡。

🚀 **未来展望:** 未来的Agentic Deep Research将朝着可信的Human-in-loop系统、垂直领域专家级深研、结构化-组织型深研系统以及多模态信息融合等方向发展。高效的Test-Time Scaling和资源自管理将是关键。

2025-07-04 17:21 四川

Introducing deep research: An agent that uses reasoning to synthesize large amounts of online information and complete multi-step research tasks for you.

OpenAI

时代信号:信息入口的悄然易主

这些迹象共同揭示:人们不再满足于搜索关键词+翻网页,而是希望 AI 能主动调研、分析、整合、最终给出结论。传统搜索的时代,正在发生一场系统性的变革。

本文所解读的论文《From Web Search towards Agentic Deep Research: Incentivizing Search with Reasoning Agents》由伊利诺伊大学(芝加哥分校、香槟分校)联合清华大学、北京大学、UCLA、UCSD、亚马逊、Salesforce、港中文等全球多所高校与企业 AI 研究员共同完成。完整资源见项目页:https://github.com/DavidZWZ/Awesome-Deep-Research

范式演进:从 Web Search 到 Agentic Deep Research 

研究与社区热度:范式跃迁的强劲动能

学术层面 DeepResearcher、Search-R1、R1-Searcher 等论文在 2025 年密集发布,重点探讨 推理-检索协同 与 强化学习代理。

开源生态 DeepSearcher、DeerFlow、ODS、WebThinker……多款项目数周内斩获千星;论文统计显示 Deep Research 相关库的 star 曲线 显著高于传统 RAG 项目。

为系统评估 Agentic Deep Research 模型的实用价值,作者引入三项高难评测基准,涵盖多步骤、多源知识聚合任务。 在BrowseComp、 BrowseComp-ZH、HLE,标准 LLM(如 GPT-4、Claude-3)表现普遍低于 20%,而 OpenAI Deep Research Agent 在三项任务中分别达成 51.5%、42.9%、26.6%,显著优于各类baseline。

方法论精要:三大技术支柱

DeepSeek-R1、OpenAI O1 等模型通过多阶段微调与 RL 提升了数理推理、任务分解和自省能力,是 Deep Research 能够实现的核心基础。它们能够在没有检索的情况下先行制定查询计划,为后续搜索提供结构化指令。

单靠模板 Prompt 与监督微调不足以应对开放环境;RL 在封闭API或真实 Web 环境中提供试错信号。从ReAct -> WebGPT -> Search-R1 / R1-Searcher:将“检索正确率 + 解释透明度”写入奖励函数。DeepResearcher:在真实浏览器环境中学习点击、滚动、提问等操作,逐步逼近人类研究流程。模型不依赖静态提示,而是能 自主探索外部世界、动态调整策略。

论文提出的 TTS Law 假设:推理深度(内部知识推理)与检索轮次(外部知识探索)在给定 token 预算内存在可预测的 线性增益与权衡。如任务偏事实:应投入更多 token 于检索;对应任务偏逻辑:应留足链式推理空间。为未来系统设计提供“预算分配指南”,也为云端部署节省成本。

未来展望:面向下一代 Agentic Deep Research

推荐阅读


    欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

    阅读原文

    跳转微信打开

    Fish AI Reader

    Fish AI Reader

    AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

    FishAI

    FishAI

    鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

    联系邮箱 441953276@qq.com

    相关标签

    Deep Research AI Agent LLM 搜索变革
    相关文章