AI科技评论 01月27日
港大最新研究成果:MiniRAG,「迷你版」RAG 小模型端侧可用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

香港大学黄超教授团队推出的MiniRAG框架,通过创新架构优化,使仅有1.5B参数的小型模型也能达到接近GPT-4mini的RAG任务性能,显著降低了算力需求。MiniRAG采用语义感知异构图索引和轻量级图式知识检索,实现了高效的检索增强生成系统,特别适合在资源受限的端侧设备上运行。该框架不仅解决了传统RAG系统高资源需求和部署门槛的问题,还为端侧RAG系统的部署和数据隐私保护提供了可行方案。同时,研究团队还推出了LiHua-World数据集,用于全面评估MiniRAG在实际端侧应用中的性能。

💡MiniRAG 框架通过轻量级架构创新,使小型模型在RAG任务中表现出色,解决了传统RAG系统对大型模型的依赖,降低了部署门槛,保护了端侧用户数据隐私。

🔍 MiniRAG 提出了语义感知异构图索引,融合文本块和命名实体构建层次化语义网络,提高了检索准确度,并避开了小型语言模型在文本概括方面的短板,保留原始信息准确性。

⚙️ MiniRAG 采用轻量级图式知识检索机制,结合语义感知异构图和轻量级文本嵌入,实现了高质量的知识获取,降低了检索过程对模型性能的要求,适合资源受限的端侧设备。

📊 LiHua-World 数据集为评估 MiniRAG 在端侧应用中的性能提供了基准,包含单跳查询、多跳推理和信息总结等多种任务类型,覆盖社交、健身、娱乐等领域,并配备专业标注,确保评估的准确性。

2025-01-23 17:18 重庆

传统RAG系统的高资源需求和部署门槛一直是行业痛点。

MiniRAG让仅有1.5B参数的小型模型也能达到接近GPT-4mini的RAG任务性能,大幅降低了算力需求。

传统RAG系统的高资源需求和部署门槛一直是行业痛点,香港大学黄超教授团队最新推出的MiniRAG框架为此提供了创新解决方案。通过突破性的架构优化设计,MiniRAG让仅有1.5B参数的小型模型也能达到接近GPT-4mini的RAG任务性能,大幅降低了算力需求。这一突破不仅让端侧RAG系统部署成为可能,更为RAG技术的应用探索新途径。

项目链接: https://github.com/HKUDS/MiniRAG

论文链接: https://arxiv.org/abs/2501.06713

实验室主页: https://github.com/HKUDS



1


为什么需要 MiniRAG?现有 RAG 系统的局限性

高资源需求与部署门槛

传统RAG系统通常依赖于大型语言模型(LLMs),这些模型虽然性能强大,但对计算资源和存储空间的需求极高,导致其难以在资源受限的端侧设备上部署。此外,大型模型的复杂性和高成本也限制了RAG技术在更广泛场景中的应用。

小型语言模型的性能瓶颈

现有的RAG框架在设计上主要针对大型语言模型,直接将其应用于小型语言模型(SLMs)时,性能往往大幅下降。特别是在查询理解、多步推理、语义匹配和信息合成等关键环节,小型模型的表现明显不足,难以满足实际应用需求。

数据隐私与端侧需求

随着数据隐私保护意识的增强,端侧设备上的数据处理需求日益增加。然而,传统RAG系统由于依赖云端大型模型,难以在端侧实现高效且隐私保护的知识检索与生成。MiniRAG通过轻量级架构设计,成功解决了这一问题,为端侧RAG系统的部署提供了可行方案。


2


MiniRAG的核心设计

MiniRAG通过突破性的轻量级架构创新,成功构建了一个高效的检索增强生成系统。该系统无需依赖庞大的语言模型,不仅显著降低了部署门槛,更能有效保护在端侧RAG系统中用户的数据隐私。

MiniRAG框架

MiniRAG提出了两大核心创新组件:语义感知异构图索引和轻量级图式知识检索。这些设计使得系统能够在保证检索质量的同时,大幅降低对模型能力的依赖,特别适合在资源受限的端侧设备上运行。

语义感知异构图索引

MiniRAG通过融合文本块和命名实体,构建层次化语义网络。这种双层结构不仅提高了检索结果的准确度,还巧妙避开了小型语言模型在文本概括方面的短板,最大限度地保持了原始信息的准确性。

轻量级知识检索

针对端侧设备的计算资源限制,MiniRAG采用图式知识检索机制,结合语义感知异构图和轻量级文本嵌入,实现了高质量的知识获取。该机制通过简化的解析流程和拓扑增强检索策略,显著降低了检索过程对模型性能的要求。

LiHua-World:模拟真实端侧场景的评测数据集

LiHua-World数据集,记录了LiHua一年的通讯数据

为全面评估MiniRAG在实际应用中的性能,研究团队同步推出了首个专门面向端侧环境的评测基准——LiHua-World。这个精心设计的数据集通过模拟真实的个人设备通信数据,系统性地覆盖了端侧场景下的多样化检索需求和知识增强应用,为轻量级RAG系统的发展提供了重要的评估工具。

数据集特点


3


实验评估与分析

实验结果

系统性能对比

不同方法的存储效率与准确率

组件效果分析

消融实验

为全面评估 MiniRAG 各组件的性能贡献,研究团队设计了两组系统化的消融实验。第一组实验 (-$I$) 将 MiniRAG 的异构图索引替换为传统的基于描述的索引方法,该方法与 LightRAG 和 GraphRAG 类似,主要依赖模型的语义理解能力来生成实体与关系描述。第二组实验 (-$R_i$) 通过在图检索过程中选择性停用特定功能模块,以量化分析各模块对系统整体表现的影响。

实验结果表明:

实际场景案例研究

案例研究

MiniRAG通过一个复杂的餐厅识别案例,有力展示了其在实际应用中的卓越性能,特别是在处理多约束查询和克服小型语言模型局限性方面的优势。

挑战:复杂查询解析的困境 

研究团队选取了一个具有挑战性的测试案例,查询内容为:Wolfgang和Li Hua为庆祝Wolfgang升职而共进晚餐的那家意大利餐厅叫什么名字?这一查询涉及多重约束条件,要求系统能从在线聊天数据中准确识别特定意大利餐厅及其相关上下文。在这个测试中,两种RAG方法都使用phi-3.5-mini-instruct小语言模型。受限于小型语言模型的固有局限性,特别是在提取high-level信息和处理图索引噪声方面的不足,导致LightRAG的检索效果不够理想。

MiniRAG的解决方案

创新的知识发现机制,MiniRAG通过其独特的查询引导推理路径发现机制成功应对了上述挑战。系统利用异构图索引结构,首先预测答案类型(如"社交互动"或"地点"),然后通过策略性分解查询要素(专注于"意大利场所"和"餐厅"语境),结合目标实体匹配,实现了精确且具有上下文关联的知识检索。这种结构化推理方法使MiniRAG即便使用小型语言模型也能够精确导航知识空间,最终成功定位目标餐厅——Venedia Grancaffe。


4


未来研究方向


5


总结

MiniRAG的提出为端侧RAG系统的研究与应用提供了全新的解决方案。通过其轻量级架构设计、创新的异构图索引和高效的检索机制,MiniRAG不仅突破了传统RAG系统的高资源需求瓶颈,还为端侧设备上的知识检索与生成开辟了新的可能性。随着LiHua-World评测基准的发布,MiniRAG有望进一步推动RAG技术在端侧设备上的普及与应用。如需了解更多信息,请访问项目链接:

https://github.com/HKUDS/MiniRAG。


更多内容,点击下方关注:

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!


公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniRAG RAG 小型语言模型 端侧部署 知识检索
相关文章