PaperAgent 01月15日
MiniRAG:一个极致简洁、高效的新型RAG系统
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

MiniRAG是由香港大学提出的一个极简开源RAG框架,旨在解决小型语言模型(SLMs)在RAG系统中性能不足的问题。它通过引入语义感知的异构图索引和轻量级的拓扑增强检索技术,有效提升了SLMs在信息检索任务中的表现。MiniRAG将文本块和命名实体整合到图结构中,减少了对复杂语义理解的依赖,并利用图的拓扑结构实现高效的知识发现。实验结果表明,MiniRAG在使用SLMs时,性能与基于LLM的方法相当,且仅需25%的存储空间,同时还贡献了一个全面的基准数据集LiHua-World用于评估轻量级RAG系统。

💡MiniRAG 针对小型语言模型(SLMs)在检索增强生成(RAG)框架中的局限性,提出了一种极简且高效的解决方案,尤其是在设备端RAG系统上实现了优化。

🧩 核心创新在于语义感知的异构图索引机制,它将文本片段和命名实体整合到一个统一的图结构中,减少了对复杂语义理解的依赖,并降低了索引的复杂度,从而提高检索效率。

🔍 MiniRAG采用了轻量级的拓扑增强检索方法,通过图结构高效发现知识,即使在SLMs语义理解能力有限的情况下,也能通过节点间的连接关系找到相关信息,提高了检索的准确性和效率。

📊 大量实验验证了MiniRAG的有效性,在使用小型语言模型时,其性能可与基于大型语言模型的方法相媲美,同时仅需25%的存储空间,并发布了LiHua-World基准数据集用于评估轻量级RAG系统。

2025-01-14 11:42 湖北

MiniRAG一个极简的开源RAG框架,通过异质图索引和轻量级的拓扑增强检索,让小模型也能取得很好的RAG效果。

高效且轻量级RAG系统需求日益增长,但RAG框架中部署小型语言模型(SLMs)在语义理解和文本处理上存在局限,阻碍了广泛应用。

与 LLMs 相比,SLMs 在索引和回答阶段都显示出显著的局限性左侧:SLMs生成的描述质量明显低于LLMs。右侧:SLMs难以在大篇幅的上下文中找到相关信息,而LLMs则能有效地完成这项任务。

为此,香港大学提出并开源MiniRAG,这是一种专为极简和高效而设计的新型RAG系统。

MiniRAG架构解决了设备端 RAG 系统面临的独特挑战,在效率和效果之间实现了优化

MiniRAG引入了两项关键技术创新:(1)一种语义感知的异构图索引机制,将文本块和命名实体结合在一个统一结构中,减少了对复杂语义理解的依赖;(2)一种轻量级的拓扑增强检索方法,利用图结构实现高效的知识发现,而无需高级语言能力。

语义感知的异构图索引机制

轻量级的拓扑增强检索

大量实验表明,MiniRAG在使用SLMs时,性能与基于LLM的方法相当,同时仅需25%的存储空间。此外,还贡献了一个全面的基准数据集LiHua-World,用于评估轻量级RAG系统在现实设备场景下处理复杂查询的能力。

使用准确率(acc)和错误率(err)进行性能评估,以百分比(%)表示。较高的准确率和较低的错误率表明RAG性能更好。结果比较了MiniRAG与各种基线方法在多个数据集上的表现。粗体值表示最佳性能,而“/”表示方法未能生成有效回答的情况。

案例研究比较了LightRAG和MiniRAG在复杂餐厅识别查询上的表现,展示了如何通过查询引导的推理路径发现有效解决小型语言模型(SLM)在多约束信息检索任务中的局限性。

LiHuaWorld模拟了一个数字化互联的世界,在这个世界中,人工智能代理通过移动聊天应用程序进行交流。通过我们的主要角色李华的视角,我们观察并收集了这个虚拟社会生态系统中真实的聊天互动

https://arxiv.org/pdf/2501.06713MINIRAG: TOWARDS EXTREMELY SIMPLE RETRIEVAL-AUGMENTED GENERATIONhttps://github.com/HKUDS/MiniRAG/tree/main

推荐阅读


欢迎关注我的公众号“PaperAgent”,每天一篇大模型(LLM)文章来锻炼我们的思维,简单的例子,不简单的方法,提升自己。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniRAG RAG框架 小型语言模型 异构图索引 拓扑增强检索
相关文章