北京邮电大学百家AI团队研发的MemoryOS,是首个模拟人脑记忆机制的大模型记忆操作系统。它通过分层记忆架构和动态更新策略,有效解决大模型在长期对话中的“健忘”问题。MemoryOS采用三级记忆体系,包括短期、中期和长期记忆,并结合段页式存储优化和主题聚类算法,实现高效的记忆管理和秒级检索响应。研究团队还推出了基于模型上下文协议(MCP)的MemoryOS MCP Server接口,降低了开发者集成记忆管理能力的门槛,推动AI从“短时记忆”向“认知智能”跨越。
🧠 MemoryOS的核心在于其创新的分层记忆架构,它模拟人脑认知机制,构建了短期、中期和长期三级记忆体系。短期记忆用于存储当前对话的原始数据,中期记忆通过“分段分页”技术进行主题化归档,长期记忆则持续更新用户画像,存储个性化特征,例如用户喜好。
🔄 动态更新策略是MemoryOS的关键组成部分,它能够智能管理记忆。当用户提及特定话题时,系统会基于热度算法自动提升该话题的优先级,确保后续对话的连贯性,从而实现更自然的交互体验。
🚀 MemoryOS在效率优化方面表现出色,其段页式存储优化结合主题聚类与时间衰减算法,实现了秒级检索响应和关键记忆精准定位。实验结果表明,MemoryOS在LoCoMo基准测试中,F1分数提升了49.11%,BLEU-1指标提升了46.18%。
💡 MemoryOS MCP Server接口的推出,为开发者提供了标准化、低门槛的记忆管理能力集成方案。开发者无需深入理解底层架构,即可通过调用MCP Server提供的模块化工具,为各类AI应用注入长效记忆能力,极大地降低了开发门槛。
刘雅坤 2025-06-18 13:57 北京
随着大模型应用场景的不断拓展,其在处理长期对话时逐渐暴露出的记忆局限性日益凸显,主要表现为固定长度上下文窗口导

随着大模型应用场景的不断拓展,其在处理长期对话时逐渐暴露出的记忆局限性日益凸显,主要表现为固定长度上下文窗口导致的“健忘”问题。针对这一挑战,北京邮电大学百家 AI 团队创新性地提出了首个模拟人脑记忆机制的大模型记忆操作系统 MemoryOS,其核心突破在于实现了分层记忆架构与动态更新策略的有机结合。MemoryOS 采用三级记忆体系模拟人脑认知机制:短期记忆作为工作台存储当前对话原始数据;中期记忆通过类操作系统的“分段分页”技术实现主题化归档;长期记忆则持续更新用户画像,存储如用户“讨厌洋葱”这样的个性化特征。这种分层设计通过动态更新策略实现智能记忆管理,例如当用户提及“最近在健身”时,系统会基于热度算法自动提升该话题优先级,确保后续对话的连贯性。图丨MemoryOS 的总体架构,包括记忆存储、更新、检索和响应模块(来源:arXiv)
日前,相关论文以《人工智能代理的记忆操作系统》(Memory OS of AI Agent)为题发表在预印本网站 arXiv 上 [1]。北京邮电大学
研究生康佳政是第一作者,白婷副教授担任通讯作者。
图丨相关论文(来源:arXiv)
为验证 MemoryOS 的性能,研究团队在 LoCoMo 基准测试中进行了实验。结果显示,MemoryOS 的 F1 分数提升了 49.11%,BLEU-1 指标提升了 46.18%,且在响应正确性与上下文连贯性方面均优于现有方法。(来源:该团队)值得注意的是,MemoryOS 在效率优化方面表现突出:其段页式存储优化结合主题聚类与时间衰减算法,实现了秒级检索响应和关键记忆精准定位。LoCoMo 测试数据显示,MemoryOS 平均仅需 4.9 次大模型调用(显著低于 A-Mem 的 13 次)和 3874 个 token 消耗(远少于 MemGPT 的 16977),显著降低了计算开销。其动态负载均衡机制能根据对话复杂度自动调整策略,有效避免“记忆过载”。表丨LoCoMo 数据集上的对比效果(来源:arXiv)
这些实验结果表明,MemoryOS 不仅解决了长期对话中的记忆连贯性问题,还通过个性化记忆保留机制实现了数百轮对话中的稳定性能。该系统的创新性在于,将人脑记忆机制与计算机存储技术相融合,为大模型记忆管理提供了兼具生物启发性和工程实用性的解决方案。图丨案例研究展示引入我们记忆管理系统带来的积极影响。左图:默认大语言模型;右图:搭载记忆操作系统(来源:arXiv)
在 MemoryOS 基础上,研究团队进一步开发了基于模型上下文协议(MCP,Model Context Protocol)的 MemoryOS MCP Server 接口。该接口旨在为开发者提供标准化、低门槛的记忆管理能力集成方案,降低技术使用门槛。百家 AI 团队负责人白婷教授对 DeepTech 表示,MemoryOS-MCP 服务的推出,标志着 MemoryOS 从“记忆操作系统”升级为“记忆生态基础设施”。希望通过标准化接口,让更多开发者轻松获得先进的记忆管理能力,共同推动 AI 从“短时记忆”向“认知智能”跨越。图丨白婷(来源:白婷)与底层 MemoryOS 侧重于实现长效记忆与个性化交互(核心技术为三级存储架构与动态更新机制)不同,MCP 版本定位为上层生态扩展的标准化接口服务,其核心价值在于解决工业化落地的集成难题。开发者无需理解底层架构或适配不同框架,通过调用 MCP Server 提供的模块化工具能够“即插即用”地为各类 AI 应用(如对话机器人、智能助手、垂直领域大模型)注入长效记忆能力,大幅降低了开发门槛。表丨MemoryOS 与 MemoryOS MCP 版本对比(整理:DeepTech)MCP 的实现带来了诸多优势:首先,千轮对话不“断片”,继承 MemoryOS 的动态记忆更新机制,保持上下文连贯性;其次,个性化交互零开发,自动沉淀用户画像,生成基于历史对话的专属响应;最后,无缝适配,支持 Cline、Cursor 等主流 Agent 客户端,实现一键自动集成记忆管理。此外,基于 MemoryOS 的段页式存储优化,MCP 还具备高效记忆引擎,性能零损耗。它能够实现秒级检索响应,通过主题聚类与时间衰减算法精准定位关键记忆;动态负载均衡,自动根据对话复杂度调整记忆策略,避免“记忆过载”;以及无缝集成,实现“开箱即用”的高效接入。图丨MemoryOS 支持列表(来源:该团队)MCP 的标准化能力正在重塑多场景 AI 交互体验:在智能客服领域,系统可自动沉淀用户历史咨询记录,提供个性化解决方案;教育助手中,通过追踪学习进度与知识薄弱点,实现学习路径定制;情感陪伴场景下,通过记忆关键信息,可基于用户性格特征与对话习惯生成专属响应。
目前,MemoryOS 的 MCP 服务已随 MemoryOS v1.1 版本开源发布,并配套提供了完整的开发者文档。另据悉,百家 AI 团队将在 7 月开启 MemoryOS 平台内测,MemoryOS 平台搭载更强记忆管理算法,提供数据可视化分析和更多业务功能服务。MemoryOS 平台内测码申请:https://www.wjx.cn/vm/mo38ETs.aspx# 参考资料:1.https://arxiv.org/pdf/2506.063262.开源项目地址:https://github.com/BAI-LAB/MemoryOS运营/排版:何晨龙01/ 世界首颗超高并行光计算芯片问世:科学家在光芯片上实现超100并行度光计算,算力呈数量级提升
02/ 模型到底是真编程还是背代码?斯坦福团队打造开源基准库,模型科研编程能力一测便知
03/ 在美国死亡谷成功“造水”,MIT团队打造大气水收集器,成功生成161.5毫升锂离子浓度低于0.06ppm的安全用水
04/ 科学家提出动力学扩展定律,让稀疏注意力问题解决率最高提高60%,支持更长的文本生成
05/ 首个金属核轮烯分子问世,南科大团队合成全新金属轮烯化合物,有望用于高性能电子器件等














阅读原文
跳转微信打开