IT之家 01月16日
面壁智能发布 MiniCPM-o 2.6 全模态模型,号称“端侧 GPT-4o”
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

面壁智能推出端侧全模态模型MiniCPM-o 2.6,参数8B,性能比肩GPT-4o等。它采用端到端多模态架构,能处理多种数据,生成高质量输出,支持多种进阶能力,在OpenCompass榜单上表现优异,并提供开源地址。

🎈面壁智能推出MiniCPM-o 2.6端侧全模态模型,参数8B。

💻可同时处理文本、图像、音频和视频等多类型数据。

🌟具备多种进阶能力,如可配置声音的中英双语语音对话等。

🎉在OpenCompass榜单上平均得分70.2,表现出色。

IT之家 1 月 16 日消息,面壁智能公众号今日宣布推出“小钢炮”MiniCPM-o 2.6 端侧全模态模型,参数为 8B,号称性能比肩 GPT-4o、Claude-3.5-Sonnet。

其采用了端到端多模态架构,可同时处理文本、图像、音频和视频等多种类型的数据,生成高质量文本和语音输出。官方表示,其总参数量 8B,视觉、语音和多模态流式能力达到了 GPT-4o-202405 级别,是开源社区中模态支持最丰富、性能最佳的模型之一。

MiniCPM-o 2.6 支持可配置声音的中英双语语音对话,还具备情感 / 语速 / 风格控制、端到端声音克隆、角色扮演等进阶能力。

据官方介绍,MiniCPM-o 2.6 也是首个支持在 iPad 等端侧设备上进行多模态实时流式交互的多模态大模型。其在 OpenCompass 榜单上(综合 8 个主流多模态评测基准)平均得分 70.2,以 8B 量级的大小在单图理解方面超越了 GPT-4o-202405、Gemini 1.5 Pro 和 Claude 3.5 Sonnet 等主流商用闭源多模态大模型。

IT之家附开源地址:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniCPM-o 2.6 面壁智能 多模态 端侧模型
相关文章