PaperAgent 02月18日
比GraphRAG更懂“思考”,微软又开源PIKE-RAG:主打复杂私域知识理解和推理
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

微软发布了PIKE-RAG,旨在提升复杂企业场景中私域知识的提取、推理和应用能力。该方法通过构建连贯的推理逻辑,逐步引导LLM获得准确的响应。PIKE-RAG框架由文档解析、知识抽取、知识存储、知识检索、知识组织、以知识为中心的推理以及任务分解与协调等模块组成。它通过调整主模块内的子模块,实现侧重不同能力的RAG系统,以满足现实场景的多样化需求。在工业制造、采矿、制药等领域测试表明,PIKE-RAG显著提升了问答准确率。微软已开源报告、代码和demo。

🧩PIKE-RAG专注于提取、理解和应用领域特定知识,构建连贯的推理逻辑,以提升LLM获得准确响应的能力。它解决了传统RAG方法在处理专业语料库时,难以提取深度领域知识和进行逻辑推理的难题。

📚PIKE-RAG框架由文档解析、知识抽取、知识存储、知识检索、知识组织、以知识为中心的推理以及任务分解与协调等核心模块构成。通过调整这些模块,可以定制不同侧重点的RAG系统,满足多样化的现实场景需求。

🎯PIKE-RAG通过上下文感知切分技术、自动术语标签对齐技术和多粒度知识提取方法,提高了知识提取和检索的准确率,从而增强了事实信息检索能力。这解决了传统方法中知识切分不当和嵌入模型对齐专业术语能力不足的问题。

🧪PIKE-RAG在准确率和F1分数等指标上优于Zero-Shot CoT、Naive RAG等方法,尤其在需要整合多源信息和进行多步骤推理的复杂推理任务中表现出色。该框架还首次提出了5级RAG系统能力与挑战,并针对不同层级提出了相应的策略。

2025-02-14 11:26 湖北

继GraphRAG之后,微软又发布PIKE-RAG,主打在复杂企业场景中私域知识提取、推理和应用能力PIKE-RAG 已在工业制造、采矿、制药等领域进行了测试,显著提升了问答准确率。报告、代码、demo均已开源(在文末)。

demo示例:多层次异构的知识库构建与检索+自我进化的领域知识学习

RAG系统在满足现实世界应用的复杂和多样化需求方面仍然面临挑战。仅依靠直接检索不足以从专业语料库中提取深度领域特定知识并进行逻辑推理。

企业场景复杂多样的Query

基于此,微软亚洲研究院提出了 PIKE-RAG (sPecalized KnowledgE and Rationale Augmented Generation) 方法,该方法专注于提取、理解和应用领域特定知识,同时构建连贯的推理逻辑,以逐步引导 LLM 获得准确的响应。

PIKE-RAG框架主要由几个基本模块组成,包括文档解析、知识抽取、知识存储、知识检索、知识组织、以知识为中心的推理以及任务分解与协调。通过调整主模块内的子模块,可以实现侧重不同能力的RAG系统,以满足现实场景的多样化需求。

例如,在患者历史病历搜索中,侧重于事实信息检索能力。主要挑战在于:

利用 PIKE-RAG,可以在知识提取过程中使用上下文感知切分技术、自动术语标签对齐技术和多粒度知识提取方法来提高知识提取和检索的准确率,从而增强事实信息检索能力,流程:

对于像为患者制定合理的治疗方案和应对措施建议这样的复杂任务,需要更高级的能力:

多智能体规划也将有助于兼顾创造力和可靠性。在这种情况下,可以初始化下面更丰富的管道来实现这一点。

Zero-Shot CoT、Naive RAG、Self-Ask、GraphRAG Local、GraphRAG Global相比,PIKE-RAG 在准确率、F1 分数等指标上均表现出色,PIKE-RAG 在处理复杂推理任务方面具有显著优势,特别是在需要整合多源信息、进行多步骤推理的场景中。

首次提出了5级RAG系统能力与挑战,针对不同系统层级的技术挑战,PIKE-RAG框架都有针对性策略。以下缩写被使用:“PA”代表文件解析,“KE”代表知识抽取,“RT”代表知识检索,“KO”代表知识组织,“KR”代表以知识为中心的推理

https://arxiv.org/abs/2501.11551https://github.com/microsoft/PIKE-RAGPIKE-RAG: sPecIalized KnowledgE and Rationale Augmented Generation

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

PIKE-RAG RAG 知识提取 LLM 微软
相关文章