2025-06-06 17:01 北京
Mi-BRAG简介
Mi-BRAG是小米大模型团队自主研发的智能知识库问答框架,该框架通过四大核心技术体系重构知识处理范式,支持多场景定制化的智能知识问答技术方案。目前Mi-BRAG已在公司多个场景中落地,包括小爱同学的个人信息问答、汽车问答助手、商品问答等。▍全格式兼容
多文档智能解析引擎:搭载文档智能解析引擎,可无损处理PDF、Word、Excel等十余种文档格式,为企业构建统一知识库奠定基础。金字塔知识体系:为文档解析内容构建金字塔知识体系,就像为知识库安装了智能导航,既能精准定位具体段落,又能快速把握全局脉络。▍全模态解析
支持图文混合等多元信息:利用多模态大模型能够精准解析复杂图片、表格、图文混排等多元信息。当用户搜索图表内容时,不仅能够找到文字描述,还能精确关联到具体的图片、表格。让知识检索突破模态壁垒,实现1+1>2的融合价值。模态拓展:可进一步拓展到音频、视频等模态,达到全模态贯通的效果。▍高质量检索
多维度语义索引:Mi-BRAG突破单一embedding或关键词匹配的模式,采用多维度索引为每个知识片段生成多维度语义标签,如智能提炼渐进式内容摘要、生成关联性假设问题、提取文本所属关键词、多视角内容改写等多种方式。启发性的假设性内容:检索过程中经常面临查询与文档语义空间不一致,导致用户查询和文档匹配不高的问题。为了优化这个问题,Mi-BRAG采用启发性的假设性文档加假设性回答的方法来加强语义的一致性。多轮对话:通过多轮的对话对当前查询进行深度语义重构,精准洞察并明晰用户潜在意图。▍鲁棒生成与细粒度溯源
Mi-BRAG为了提升模型的多模态上下文理解和关键信息提取能力,对数据和模型训练都进行了一系列的优化工作。数据层面:构建用于数据获取及组织细化的语义分割的自动化框架, 引入数据扰动等多种增强方案,以此在扩大数据覆盖范围的同时也能够有效模拟真实场景下的非规范化文本数据分布,显著提升了模型对非规范文本输入的泛化能力。模型训练层面:引入动态调整损失掩码的训练方式,并且在强化微调阶段,设计了细粒度证据索引、反思token等多种维度的奖励机制,Mi-BRAG最终可达到高准确率、高时效性的回答内容以及chunk级的溯源粒度。未来Mi-BRAG将深化多模态技术整合,打造覆盖文本、语音、视觉的全模态智能问答体系,全面赋能小米「人车家全生态」战略体系。*更多Mi-BRAG能力介绍可点击查看原文获得详细信息END