机器之心 07月25日 16:16
Meta出走华人创业团队,种子轮800万美元,要打造视觉AI记忆大脑
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

由前 Meta 顶尖科学家团队创立的 Memories.ai 宣布完成 800 万美元种子轮融资,旨在解决 AI 系统的“记忆缺失”问题,为视觉模型构建强大的“记忆大脑”。公司通过其核心创新——大视觉记忆模型(LVMM),为 AI 系统引入革命性的视觉记忆层,突破了传统 AI 在视频处理中仅限于片段式分析的局限。LVMM 能够永久保留上下文信息,精准识别时序模式,并智能对比分析新旧视觉信息,使 AI 具备类似人类的持续学习能力。该技术在安防、媒体、营销和消费电子等领域展现出巨大潜力,并已通过 API 和网页应用向用户开放,为 AI 视频理解和应用提供了里程碑式的解决方案。

💡 Memories.ai 解决了当前 AI 系统普遍存在的“金鱼记忆”问题,即缺乏对历史画面的记忆和理解前后关联的能力。通过其自主研发的大视觉记忆模型(LVMM),AI 能够突破传统片段式分析的局限,实现对海量视觉数据的持续捕获、存储和结构化。

🧠 LVMM 的核心能力在于赋予 AI 系统强大的视觉记忆。它能够永久保留上下文信息,使 AI 从孤立的帧转向对事件因果链的深度理解;精准识别时序模式,实现对人脸、物体和行为在时间轴上的持续追踪;并能智能对比分析新旧视觉信息,有效识别变化和异常,从而构建AI的“最强大脑”。

🚀 该技术在多个领域展现出巨大潜力,如安防领域可显著提升监控录像检索效率,媒体娱乐可实现对数十年内容库的即时查找,市场营销可对社交视频进行深度分析捕捉趋势。与三星等公司的合作也预示着其在消费电子领域的应用前景广阔。

💻 Memories.ai 已将 LVMM 技术通过 API 接口全面开放,并推出直观的网页应用,用户可便捷上传视频或接入现有视频库进行内容检索和深度分析。此外,还提供了如对话式视频创作助手(Video Creator)和智能营销工具(Video Marketer)等 Demo Agents,展示了其技术在实际场景中的应用能力。

机器之心报道

机器之心编辑部


大家都在关注硅谷 AI 领头羊们的抢人大戏,尤其是 Meta 近期又挖去了三位来自谷歌的 IMO 金牌研究者。


虽然说小扎(扎克伯格)铆足了劲儿要重振 Llama 雄风,正如火如荼的进行人才大引进。


但是吧,挖进去的人在 Meta 显山露水还需要一段时间,而从 Meta 离开的人的创业成果已经崭露头角了。


Dr. Shawn Shen,联合创始人兼首席执行官(左);Ben (Enmin) Zhou,联合创始人兼首席技术官(右)。


前 Meta Reality Labs 顶尖科学家团队创立的 AI 研究实验室 Memories.ai,正式宣布完成 800 万美元种子轮融资。本轮融资由 Susa Ventures 领投,三星风投(Samsung Next)、Fusion Fund 等知名机构跟投。


Memories.ai 团队已经在大模型领域完成了一项重大的突破成果,剑指 AI 系统的「记忆缺失」问题,为视觉模型创造了强大的「记忆大脑」。


「最强大脑


众所周知,大模型是标标准准的「金鱼记忆」


比如,大多数 AI 系统都缺乏对历史画面的记忆,难以理解前后之间的关联。


就像我们经常开的玩笑,「记忆是个先进先出栈」,只不过大模型的栈容量似乎总是不够用。


这种「金鱼记忆」限制了它们在需要深入理解场景和动态变化的应用中发挥作用,尤其是在视频密集型任务里表现不佳。


为了彻底解决这个问题,Memories.ai 通过其核心创新 —— 大视觉记忆模型(LVMM),为 AI 系统引入了一个革命性的视觉记忆层


该模型突破了传统 AI 在视频处理中仅限于片段式分析的范式,转而能够持续捕获、存储和结构化海量的视觉数据,从而使 AI 模型能够:


永久保留上下文信息: 从孤立的帧转向对事件因果链的深度理解。

精准识别时序模式: 实现对人脸、物体和行为在时间轴上的持续追踪和识别。

智能对比分析: 快速对比新旧视觉信息,有效识别变化和异常。


该平台把原始视频转化成可搜索、带上下文关联的数据库,让 AI 系统具备类似人类的持续学习能力,给 AI 系统配备了无限视觉记忆的「最强大脑」。这一突破让 AI 在理解视频和实际应用方面,迈出了里程碑式的一步。


该团队的大视觉记忆模型不仅在多个视觉理解任务中刷新了 SOTA 基准,更提供了一种全新的视角来解决复杂视觉信息检索与理解的挑战。


这些结果充分证明了模型在视频分类、视频检索和视频问答领域的「卓越性能」。


尤其在视觉记忆检索方面,能够高效处理那些需要大规模内容检索作为辅助参考的复杂查询,从而显著提升了模型的应用广度与深度。



「巨大潜能」


LVMM 技术在多个关键领域展现出巨大的应用潜力,其核心优势在于:


    时间跨度无限制: 能够处理并记忆数月甚至数年的视频数据。

    上下文深度理解: 不仅识别物体,更能理解事件的因果链和时序模式。

    高效检索与分析: 将原始视频转化为可搜索数据库,实现秒级检索和分析。


该团队已与多个领域的合作伙伴展开合作,推动 LVMM 技术的应用落地:


    安防安全: 显著提升监控录像的检索效率,在数秒内搜索数月的数据。

    媒体娱乐: 实现对数十年内容库中特定场景或视觉元素的即时查找。

    市场营销: 对数百万社交视频进行深度情感和提及分析,捕捉新兴趋势。

    消费电子: 为下一代移动体验引入强大的视觉记忆能力,多家手机公司,如三星已成为首批合作对象之一。


Memories.ai 联合创始人兼首席执行官沈博士强调:「人类的智慧源于丰富的、相互关联的视觉记忆。我们的使命是赋予 AI 这种深度的情境感知能力,以共同构建一个更安全、更智能的世界。」


「便捷交互」
为了让用户更直观地体验 LVMM(大视觉记忆模型)的强大能力,该团队已将核心技术通过 API 接口全面开放,并同步推出直观、可交互的网页应用。用户可以便捷地上传视频或接入现有视频库,实现快速、精准的内容检索与深度分析。


借助毫秒级精度的检索引擎,在视频问答场景中展现了卓越的视频帧级引用能力,真正实现了对视频的多模态深度解析。



还有一系列的 Demo Agents,展示了模型在不同场景下的应用能力,例如:


Video Creator 对话式视频创作助手,基于全球首个大视觉记忆模型,通过可自由编辑的提示词模板,仅用简单对话即可生成多剪辑高质量视频。



Video Marketer 是一个基于大视觉记忆模型的智能营销工具,依托海量视频数据,能即时洞察 TikTok 的爆款趋势、热门开场白和头部网红策略,助力高效实现社交视频营销。



这些 Demo Agents 不仅是技术能力的展示,更是探索未来应用的起点。


如果你是一家公司,正被海量视频数据淹没;或者是一位对视觉记忆与智能交叉点着迷的研究者;又或者只是好奇当人工智能拥有记忆之后会变成什么样 —— 欢迎访问 https://memories.ai。


© THE END 

转载请联系本公众号获得授权

投稿或寻求报道:liyazhou@jiqizhixin.com


文章原文

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Memories.ai AI 视觉记忆 大视觉记忆模型 人工智能 视频分析
相关文章