AI前线 02月03日
让大模型读懂善用知识库!清华等团队推出 UltraRAG 框架全家桶
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

UltraRAG框架由清华大学等团队联合推出,旨在简化RAG系统的搭建与优化。它提供“单反相机”级的精细配置和“卡片机”式的一键操作,降低了学习成本和开发周期。UltraRAG支持模型自动适配用户知识库,避免了模型选型难题;其模块化设计方便科研人员快速迭代。用户可以通过WebUI轻松完成模型构建、训练和评估,无需编写代码。此外,UltraRAG还提供一键式数据构建和微调策略,以及多维多阶段的稳健评估方法,帮助用户高效管理数据和模型,无论是科研探索还是业务落地都能得心应手。

🛠️UltraRAG框架革新了传统RAG系统的开发方式,提供极简WebUI,无编程经验的用户也能轻松完成模型构建、训练与评测,并集成了多种预设工作流,用户可灵活选择最优路径。

⚙️UltraRAG以自研的KBAlign、DDR等方法为核心,提供一键式系统化数据构建,并结合检索与生成模型的多样化微调策略,全面优化性能。覆盖从检索到生成模型全流程数据构建方案,支持基于用户知识库自动生成训练数据。

📊UltraRAG采用UltraRAG-Eval方法,融合多阶段评估策略,提升模型评估的稳健性,覆盖从检索到生成模型的多维评估指标,并提供精准反馈,助力开发者持续优化模型与方法。

💡UltraRAG内置多项创新技术,如UltraRAG-KBAlign提升模型自适应知识库能力,UltraRAG-Embedding支持长文本与稀疏检索,UltraRAG-Vis实现纯视觉RAG Pipeline,UltraRAG-Adaptive-Note提升复杂问答质量,UltraRAG-DDR优化检索增强生成。

🏆UltraRAG系列方法在AI社区有一定影响力,部分模型拥有数十万次下载量,并在领域内顶尖机构受邀进行学术报告,部分模型曾位居中文模型下载量榜首。

2025-02-02 13:30 辽宁

RAG 系统的搭建与优化是一项庞大且复杂的系统工程,通常需要兼顾测试制定、检索调优、模型调优等关键环节,繁琐的工作流程往往让人无从下手。

作者 | OpenBMB 开源社区

RAG 系统的搭建与优化是一项庞大且复杂的系统工程,通常需要兼顾测试制定、检索调优、模型调优等关键环节,繁琐的工作流程往往让人无从下手。

近日,针对以上痛点,清华大学 THUNLP 团队联合东北大学 NEUIR 、面壁智能及 9#AISoft 团队共同推出了 UltraRAG 框架,该框架革新了传统 RAG 系统的开发与配置方式,极大降低了学习成本和开发周期。UltraRAG 不仅具备满足专业用户需求的“单反相机”级精细化配置能力,同时也提供类似“卡片机”的一键式便捷操作,让 RAG 系统的构建变得极简且高效

更重要的是,相比传统 RAG 系统,UltraRAG 支持自动化地将模型适配到用户提供的知识库,有效避免了在“模型选型”时的反复纠结;同时,其 模块化设计 又能为科研需求快速赋能,帮助研究者在多种场景下自由组合、快速迭代。通过 UltraRAG,用户可以轻松完成从数据到模型的全流程管理,不论是要开展深度科研探索,还是进行快速业务落地,都能“随心所欲,得心应手”。

Github 地址:

https://github.com/OpenBMB/UltraRAG

零代码编程 WebUI 支持

UltraRAG 以其极简的 WebUI 作为核心优势之一,即便是无编程经验的用户,也能轻松完成 模型的构建、训练与评测。无论是快速开展实验,还是进行个性化定制,UltraRAG 均能提供直观且高效的支持。该框架集成了多种预设工作流,用户可根据具体需求灵活选择最优路径,无需编写繁琐代码,即可完成从数据处理到模型优化的全流程操作。

以下是操作演示:

合成与微调一键式解决

UltraRAG 以自研的 KBAlignDDR 等方法为核心,提供一键式系统化数据构建,结合检索与生成模型的多样化微调策略,助力性能全面优化。在数据构造方面,UltraRAG 覆盖从检索模型生成模型的全流程数据构建方案,支持基于用户导入的知识库自动生成训练数据,显著提升场景问答的效果与适配效率。在模型微调方面,UltraRAG 提供了完备的训练脚本,支持 Embedding 模型训练及 LLM 的 DPO/SFT 微调,帮助用户基于数据构建更强大、更精准的模型。

多维多阶段稳健式评估

UltraRAG 以自研的 UltraRAG-Eval 方法为核心,融合针对有效与关键信息的多阶段评估策略,显著提升模型评估的稳健性,覆盖从检索模型生成模型的多维评估指标,支持从整体到各环节的全面评估,确保模型各项性能指标在实际应用中得到充分验证。通过关键信息点锚定,UltraRAG 有效增强评估的稳定性与可靠性,同时提供精准反馈,助力开发者持续优化模型与方法,进一步提升系统的稳健性与实用性。

科研友好探索工作集成

UltraRAG 内置 THUNLP-RAG 组自研方法及其他前沿 RAG 技术,支持整个模块化的持续探索与研发。UltraRAG 不仅是一个技术框架,更是科研人员与开发者的得力助手,助力用户在多种任务场景中高效寻优。随着功能的不断完善与升级,UltraRAG 将在更广泛的领域和应用场景中发挥关键作用,持续拓展 RAG 技术的应用边界,推动从学术研究到商业应用的全面发展。其 简洁、高效、灵活且易于上手 的特性,使 RAG 框架的部署与应用更加便捷,显著降低科研与项目开发的技术复杂度,帮助用户专注于创新与实践。

UltraRAG 内置探索技术系列

UltraRAG 系列引入多项创新技术,优化了检索增强生成中的知识适配、任务适应和数据处理,提升了系统的智能性和高效性。

UltraRAG 各方法在国内外 AI 社区中享有一定的影响力和知名度,例如部分模型拥有三十万次下载量,有的曾在领域内顶尖机构受邀进行学术报告,还有的曾位居中文模型下载量榜首。

参考文献

https://arxiv.org/abs/2410.13509

Li, Xinze, Mei, Sen, Liu, Zhenghao, Yan, Yukun, Wang, Shuo, Yu, Shi, Zeng, Zheni, Chen, Hao, Yu, Ge, Liu, Zhiyuan, et al. (2024).RAG-DDR: Optimizing Retrieval-Augmented Generation Using Differentiable Data Rewards. arXiv preprint arXiv:2410.13509.

https://arxiv.org/abs/2410.10594

Yu, Shi, Tang, Chaoyue, Xu, Bokai, Cui, Junbo, Ran, Junhao, Yan, Yukun, Liu, Zhenghao, Wang, Shuo, Han, Xu, Liu, Zhiyuan, et al. (2024).Visrag: Vision-based Retrieval-Augmented Generation on Multi-Modality Documents. arXiv preprint arXiv:2410.10594.

https://arxiv.org/abs/2410.08821

Wang, Ruobing, Zha, Daren, Yu, Shi, Zhao, Qingfei, Chen, Yuxuan, Wang, Yixuan, Wang, Shuo, Yan, Yukun, Liu, Zhenghao, Han, Xu, et al. (2024).Retriever-and-Memory: Towards Adaptive Note-Enhanced Retrieval-Augmented Generation. arXiv preprint arXiv:2410.08821.

https://arxiv.org/abs/2411.14790

Zeng, Zheni, Chen, Yuxuan, Yu, Shi, Yan, Yukun, Liu, Zhenghao, Wang, Shuo, Han, Xu, Liu, Zhiyuan, Sun, Maosong. (2024).KBAlign: Efficient Self Adaptation on Specific Knowledge Bases. arXiv preprint arXiv:2411.14790.

https://arxiv.org/abs/2408.01262

Zhu, K., Luo, Y., Xu, D., Wang, R., Yu, S., Wang, S., Yan, Y., Liu, Z., Han, X., Liu, Z., & others. (2024). Rageval: Scenario specific rag evaluation dataset generation framework.arXiv preprint arXiv:2408.01262.

参考信息

前后的对比,隐私安全,举一个例子;传统方式 VS UltraRAG;

会议推荐

在 AI 大模型技术如汹涌浪潮席卷软件开发领域的当下,变革与机遇交织,挑战与突破共生。2025 年 4 月 10 - 12 日,QCon 全球软件开发大会将在北京召开,以 “智能融合,引领未来” 为年度主题,汇聚各领域的技术先行者以及创新实践者,为行业发展拨云见日。现在报名可以享受 8 折优惠,单张门票立省 1360 元,详情可联系票务经理 18514549229 咨询。

你也「在看」吗??

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

UltraRAG RAG系统 AI框架 知识库 模型优化
相关文章