IT之家 2024年09月06日
“端侧 ChatGPT 时刻到来”,面壁智能推出小钢炮开源 MiniCPM3-4B AI 模型
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

面壁智能发布开源MiniCPM3-4B模型,号称端侧ChatGPT时代来临。该模型是MiniCPM系列的第三代产品,性能超越了Phi-3.5-mini-Instruct和GPT-3.5-Turbo-0125,与多款70亿~90亿参数的AI模型相当。相比前两代,MiniCPM3-4B拥有更强大的技能集,支持函数调用和代码解释器,可用于更广泛的用途。此外,面壁智能还发布了RAG套件MiniCPM-Embedding模型和MiniCPM-Reranker模型,以及针对RAG场景的微调版MiniCPM3-RAG-LoRA模型。

🎉 **性能提升:** MiniCPM3-4B性能超越了Phi-3.5-mini-Instruct和GPT-3.5-Turbo-0125,与多款70亿~90亿参数的AI模型相当。它拥有更强大的技能集,支持函数调用和代码解释器,可用于更广泛的用途。

💻 **模型结构升级:** 相比前两代MiniCPM模型,MiniCPM3-4B在词表大小、模型层数、隐藏层节点和最大长度等方面均有提升,并支持系统提示词、工具调用和代码解释器。

🧰 **RAG套件发布:** 面壁智能还发布了RAG套件MiniCPM-Embedding模型和MiniCPM-Reranker模型,以及针对RAG场景的微调版MiniCPM3-RAG-LoRA模型。这些模型可以帮助用户更有效地进行信息检索和问答任务。

🧠 **无限上下文:** MiniCPM3-4B拥有32k上下文窗口,并借助LLMxMapReduce技术,可以处理理论上的无限上下文,为用户提供更强大的语言理解和生成能力。

💡 **端侧ChatGPT:** 面壁智能宣称MiniCPM3-4B的发布标志着端侧ChatGPT时代的到来,这将为用户带来更便捷、更高效的AI体验。

IT之家 9 月 6 日消息,面壁智能官方公众号昨日(9 月 5 日)发布博文宣布推出开源 MiniCPM3-4B AI 模型,声称“端侧 ChatGPT 时刻到来”。

IT之家附上 MiniCPM 3.0 开源地址:

MiniCPM3-4B 是 MiniCPM 系列的第三代产品,整体性能超过了 Phi-3.5-mini-Instruct 和 GPT-3.5-Turbo-0125,媲美多款 70 亿~90 亿参数的 AI 模型。

相比 MiniCPM1.0 / MiniCPM2.0,MiniCPM3-4B 拥有更强大、更多用途的技能集,可用于更广泛的用途。MiniCPM3-4B 支持函数调用和代码解释器。

下面是 3 个版本的模型结构(1->2->3)的区别:

MiniCPM3-4B 有一个 32k 上下文窗口。MiniCPM3-4B 借助 LLMxMapReduce,不需要占用太高的内存,可以处理理论上的无限上下文。

面壁智能还发布了 RAG 套件 MiniCPM-Embedding 模型和 MiniCPM-Reranker 模型,针对 RAG 场景还发布了微调版 MiniCPM3-RAG-LoRA 模型。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniCPM 面壁智能 开源模型 ChatGPT AI
相关文章