IT之家 2024年08月07日
面壁智能开源 MiniCPM-V 2.6 模型:号称端侧 AI 多模态能力对标 GPT-4V,6G 内存可用
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

面壁智能开源MiniCPM-V 2.6模型,端侧AI多模态能力对标GPT-4V,具有多种强大功能和特点。

🥇端侧多模态强大:首次在端侧实现单图、多图、视频理解等多模态核心能力全面超越GPT-4V,单图理解比肩多模态王者Gemini 1.5 Pro和GPT-4o。该模型具备多项首次上端的功能,如实时视频理解、多图联合理解等。

💪高像素密度:取得了两倍于GPT-4o的单token编码像素密度,类比知识密度。

🚀端侧性能优越:量化后端侧6G内存可用,端侧推理速度达18 tokens / s,相比上代模型快33%。发布即支持llama.cpp、ollama、vllm推理,且支持多种语言。

🎯统一高清框架:延续传统优势OCR能力的SOTA性能水平,并进一步覆盖单图、多图、视频理解。

IT之家 8 月 7 日消息,面壁智能昨日开源了 MiniCPM-V 2.6 模型,官方表示将端侧 AI 多模态能力拉升至全面对标 GPT-4V 水平

官方称 MiniCPM-V 2.6 模型仅 8B 参数,取得 20B 以下单图、多图、视频理解 3 SOTA 成绩,有以下特点:

IT之家附开源地址:

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

MiniCPM-V 2.6 端侧AI 多模态 模型开源
相关文章