2024-12-03 12:03 中国香港
一起回顾11月大事件!
十一月大事记:
? 面壁智能携手英特尔打造高效 AI PC,MiniCPM 端侧模型正获巨大市场推动和技术加速
? 面壁智能上榜《财富》人工智能创新者全球 50 强
? “法信法律基座大模型”在最高法发布
✊ 面壁小钢炮入选 2024 年“携手构建网络空间命运共同体精品案例”
? 举办 AI 萌宠硬件活动
? 联合清华团队提出新一代主动 Agent 交互范式
? 联合清华团队提出新型类脑高效稀疏 CFM 创新架构
? 联合清华大学等研究团队提出 LLMxMapReduce 长本文分帧处理技术
?️♀️ 联合清华大学等研究团队推出全新的评测方法 RAGEval
面壁智能携手英特尔打造高效 AI PC
MiniCPM 端侧模型正获巨大市场推动和技术加速
11 月 26 日,英特尔新质生产力技术生态大会(Intel Connection)在成都举办,面壁智能作为英特尔重要战略合作伙伴出席,并演示了基于英特尔最新一代桌面级旗舰芯片深度适配和加速的多模态端侧模型。
本届英特尔新质生产力技术生态大会云集了大模型、AI 计算、AI 应用的行业高管、技术专家、专业开发者代表,共同探索端侧AI的最新技术趋势,特别是 AI PC 为代表端侧硬件的创新成果与案例。在生态大会专题论坛现场,面壁智能副总裁缪钧玮发表了“面壁小钢炮:高效端侧多模态模型,AI PC 的高能时刻”的专题演讲。
(点击图片查看详情)
面壁智能上榜《财富》人工智能创新者全球 50 强
11月21日,《财富》发布第二届全球“《财富》人工智能创新者 50 强榜单”(Fortune 50 AI Innovators),面壁智能成功上榜,成为《财富》全球评选脱颖而出的几家中国AI企业代表之一。同时入选 50 强的还有 OpenAI 、Meta、微软、谷歌等全球知名科技企业。《财富》表示,2024 年 AI 创新热度不减,不仅领先的 AI 初创公司估值持续飙升,越来越强大的大语言模型和新的多模态能力,展示了令人惊叹的潜力。
据介绍,跟 2023 年的首届名单一样,《财富》考察了来自世界各地、各种规模的公司,通过行业专家、企业内部技术领导者、专注于 AI 的风险投资投资者以及《财富》技术专家团队的反馈,最终形成上榜名单。2024 年第二届,考察企业的广度更加丰富,含金量更高,涵盖了芯片和数据中心等关键基础设施、推动 AI 能力的基础前沿模型,以及在药物开发、交通和娱乐等领域应用AI的特定用途。第二届全球评选上榜的 50 家公司,它们代表了 AI 的创新、进步和潜力。
(点击图片查看详情)
“法信法律基座大模型”在最高法发布
11 月 15 日,“法信法律基座大模型”研发成果在最高人民法院正式发布。“法信法律基座大模型”定位为国家级法律人工智能基础设施。作为法律行业的基座大模型,“法信法律基座大模型”已于 10 月 21 日完成生成式人工智能服务备案,未来将广泛赋能法律行业创新发展。面壁智能首席科学家刘知远作为“法信法律基座大模型”联合研发团队代表出席并就大模型技术回答社会各界提问。
“法信法律基座大模型”基于清华大学与面壁智能科研成果转化的千亿参数通用大模型,投入最高人民法院“法信”等多个法律大数据平台中,训练语料是经过高质量专业标注的万亿字量级法律专业数据,在各级法院、科研机构和科技企业的共同努力下最终成功研发。定位为法律行业基座模型,“法信法律基座大模型”既是一个为法治领域提供生成式人工智能底层能力的基座模型,也是一套为保障法律人工智能安全发展,配套安全治理机制,提供数据资源、算力资源、评测资源的服务体系。
面壁小钢炮入选2024年“携手构建网络空间命运共同体精品案例”
11月19日,2024 年“携手构建网络空间命运共同体精品案例”发布展示活动在浙江乌镇举办。「面向网络空间开源开放的多模态大模型 MiniCPM-V」成功入选。MiniCPM-V 多模态大模型由面壁智能联合清华大学、新加坡国立大学共同研发, 实现了对文本与视觉模态信息的深度理解, 并面向网络空间进行模型开源开放。开启端侧全面对标超越GPT-4V 新时代。实现单图,多图,实时视频全维度 3SOTA。多项功能,首次上端!
➤ MiniCPM-V GitHub:
? https://github.com/OpenBMB/MiniCPM-V
AI萌宠硬件活动
11月29日,OpenBMB 联合面壁智能成功举办AI萌宠 Party,吸引了技术极客、创业者及家长等多元人群参与。活动展示了 AI 玩具在市场、技术与情感陪伴领域的创新成果。FoloToy 分享了如何从家庭需求出发推动AI玩具普及;地瓜机器人展示了 RDK 生态如何快速实现创意;Yesmark 则聚焦情感陪伴,通过多模态技术打造智能化互动体验。DIY 环节中,参与者亲手为毛绒玩具赋予“AI灵魂”,感受从传统玩具到智能萌宠的蜕变。此次活动不仅展现了 AI 玩具的技术潜力,也让更多人看到了它作为情感伙伴的可能性,为行业未来发展注入灵感。
联合清华团队提出新一代主动 Agent 交互范式
联合清华大学团队提出开创性的新一代主动 Agent 交互范式( ProActive Agent),为 AI 交互带来了突破性的解决方案。这一新范式下的 Agent 不再是简单的指令执行者,而是升级成为了具有"眼力见"的智能助手。它具备"眼中有活、主动帮助"的主观能动性,能够主动观察环境、预判用户需求,像"肚子里的蛔虫"一样,在未被明确指示的情况下主动帮用户排忧解难。主动 Agent 实现了从"被命令"到"会思考"的质的飞跃。主动 Agent 交互范式在日常生活中有丰富的应用潜力。不难预想,它可以根据用户的习惯和偏好,主动提供行程安排、工作助手、生活管家、健康管理等服务。
➤ 论文链接:
? https://arxiv.org/abs/2410.12361
➤ GitHub 地址:
? https://github.com/thunlp/ProactiveAgent
(点击图片查看详情)
联合清华团队提出了新型类脑高效稀疏 Configurable Foundation Model 创新架构
联合清华大学团队提出了一种新型类脑高效稀疏 Configurable Foundation Model (CFM)创新架构,相较 MoE 架构,CFM 架构更本质和宏观地覆盖从预训练到后训练的模块化全过程,从结果上,对于大模型「知识密度」极致提升、对于端侧模型极速低能耗推理有更显著作用。CFM 架构证实大模型本身就具有高效稀疏模块化特性 ——大模型神经元与人脑类似,在预训练过程中自发地产生了功能分化与分区的性质,各自负责语言、数学、代码等能力,且每次计算过程中大模型仅有这些分区的神经元被激活。因此,CFM 架构将大模型拆分为预训练阶段产生的涌现模块(Emergent Brick)与后训练阶段产生的定制模块(Customized Brick),使得训练大模型可以像搭积木一样,通过模块的检索、组合、更新、增长,实现复杂能力的组合。
➤ 论文链接:
? https://arxiv.org/pdf/2409.02877
(点击图片查看详情)
联合清华大学等研究团队提出 LLMxMapReduce 长本文分帧处理技术
该技术通过将长上下文切分为多个片段,可以让模型并行处理多个片段,并从不同片段中提取关键信息,然后汇总成为最终的答案,它打破大模型记忆限制,可以将大模型上下文长度无限稳定拓展,想多长就多长;该技术也对大模型长文本能力具有普遍的增强作用,且在文本不断加长的情况下,仍能保持稳定性能、减少长文本的掉分情况。比如结合了 LLMxMapReduce 框架之后的 Llama3-70B-Instruct x MapReduce 模型得分超越了包含 Kimi、GPT-4 在内的闭源和开源模型得分以及其他基于 Llama3-70B-Instruct 分治策略(即 LongAgent 和 Chain-of-Agents)的模型得分。此外,LLMxMapReduce 框架展现出较强的通用性,结合了该框架的 Qwen2-72B 和 MiniCPM3 也取得了优异的成绩。
上下文长度是衡量大模型基础能力的一项重要指标,上下文越长意味大模型拥有更大的“内存”和更长期的“记忆”,不仅能提高大模型处理数据的能力上限,还能拓宽大模型应用的广度和深度。拥有了无限上下文的大模型可以一次性读取不限字数的书籍或不限量的学术论文、简历等材料,成为人人身边更加强大的终端个人助手。大模型还可以在你授权后读取你的大众点评美食、酒店评价、微博互动内容,并牢牢记住你和 AI 跨越多年的聊天记录,成为最懂你的 AI 陪伴者。
➤ 论文链接:
? https://arxiv.org/pdf/2409.02877
(点击图片查看详情)
联合清华大学等研究团队推出全新的评测方法 RAGEval
通过快速构建场景化评估数据实现对检索增强生成(RAG)系统的“精准诊断”。相比以往 RAG 评测工作,RAGEval不仅具备适应多领域的数据快速构建能力,还提出了全新的评测指标,提供了高效、细致的评测流程。无论是在学术研究还是行业应用中,RAGEval 都为生成式AI带来了更加可信的验证方法,为每一场景中的生成质量保驾护航。
➤ RAGEval论文链接:
? https://arxiv.org/abs/2408.01262
➤ RAGEval数据与代码链接:
? https://github.com/OpenBMB/RAGEval