2025-07-15 13:16 北京
大模型,不应只拥有语言能力,还应拥有可调度且可进化的记忆能力。MemOS 是一套面向大模型记忆管理的开源框架,Preview 版本已经完成核心模块原型构建,包括:记忆提取(Memory Extraction):自动从多轮对话中识别出任务目标、事件、偏好等关键信息记忆组织(Memory Structuring):将提取的信息按图结构或层次树组织,支持跨轮链接记忆检索(Memory Query):支持通过关键词、语义标签、时间索引等方式调用历史记忆片段记忆调度(Memory Scheduling):根据用户的对话历史、偏好,将最合适的记忆放到最合适的位置MemOS 通过标准化的 MemCube 记忆单元,将明文、激活状态和参数记忆统一在同一个框架里进行调度、融合、归档和权限管理。简单来说,模型不再只是“看完即忘”,而是拥有了持续进化和自我更新的能力。在行业看来,这种面向 AI 长期记忆的操作系统思路,或许会重塑智能系统的应用边界——让大模型真正从“静态生成器”,变成可以陪伴用户长期成长的“数字同事”和“数字助理”。系统架构和核心创新在技术架构上,MemOS 参考了传统操作系统的分层理念,同时融合了忆立方(Memory³)大模型在“记忆分层管理”方面的关键技术。系统整体划分为三大核心层次:接口与应用层、记忆调度控制层,以及存储与基础设施层,构建起从前端调用到底层持久化的一体化记忆管理框架。在接口与应用层,MemOS 提供了统一、易扩展的 Memory API,开发者可通过标准接口便捷地进行记忆的新增、修改、删除、调用等操作。配合上下文工程,MemOS 让模型能够更轻松地接入多轮会话记忆、跨任务状态追踪与用户偏好持久化管理等能力,显著提升大模型在复杂交互中的个性化与持续性表现。在记忆调度与管理层,MemOS 引入了一种全新的调度机制 —— 记忆调度(Memory Scheduling)范式。该机制支持基于上下文的“下一场景预测”(Next-Scene Prediction),可以在模型尚未发起调用之前,提前加载可能需要的记忆内容,从而显著降低响应延迟、优化推理效率。图 1. 记忆调度的核心思路如上图 1 所示,MemOS 能够在不同轮次(Round)、会话(Session)甚至多智能体(Agent)协同流程中,异步预测和准备未来可能涉及的记忆片段。其核心机制是:在应用流程的关键节点部署触发器(Trigger),自动收集任务过程中的记忆线索与需求。所有触发器采集的信息将被统一送入调度监控队列(Monitoring Queue),由调度执行器(Scheduling Executor)进行消费处理。调度器会根据调用频率、上下文相关性等策略,优先将高价值记忆片段提前加载到 MemCube 中的指定位置,包括模型的 KV Cache、明文缓存区或其他中间态存储区。这一设计显著提高了对关键记忆的“即取即用”能力,为模型提供了更快、更准、更持续的认知支撑。而在记忆存储与基础设施层,MemOS 通过标准化的 MemCube 封装,将明文记忆、激活记忆和参数记忆三种形态有机整合。它支持多种持久化存储方式,包括 Graph 数据库、向量数据库等,并具备跨模型的记忆迁移与复用能力。整体来看,MemOS 不仅在技术框架上实现了对 AI 记忆的结构化、系统化管理,也为未来构建可共享、可迁移、可学习的 AI 记忆生态奠定了基础。🧑💻 欢迎加入开发者社群,一起构建 下一代面向记忆的应用研发之路~🌐 项目官网:https://memos.openmem.net/💻 GitHub:https://github.com/MemTensor/MemOS06| 提示词工程、上下文工程、MemOS 的完整对比
正如人类的智能不仅来自于感知和反应,更来自于“能记得住并据此行动”,MemOS 是让大模型具备“成长性”与“适应性”的技术基础。因此,MemOS 所倡导的记忆系统,不是替代 Prompt 和 Context,而是与它们形成演进式协同:用 Prompt 启动模型用 Context 优化交互用 Memory 持续积累、管理与学习这才是下一代 AI 应用,真正走向“智能体”的必要路径。07| 结语你可以通过提示词工程(Prompt)让模型执行任务,你也可以通过上下文工程(Context)让模型更聪明。但只有拥有记忆(MemOS),它才真正认识你、理解你、陪伴你,并且与你一起成长。智能始于记忆,更成于记忆!MemOS,让 AI 不止回应,还更懂你!