动点科技 2024年12月16日
无问芯穹发布全球首个端侧全模态理解的开源模型Megrez-3B-Omni
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

无问芯穹正式开源了其端上智能一体化解决方案中的小模型Megrez-3B-Omni,这是一个全球首个端侧全模态理解开源模型,同时开源了纯语言版本Megrez-3B-Instruct。Megrez-3B-Omni专为端侧设备设计,拥有30亿参数,结构规整,推理速度领先同类模型。它具备处理图片、音频、文本三种模态数据的能力,并在多项测评中表现优异。通过软硬件协同优化,该模型最大化利用硬件性能。Megrez-3B-Instruct还具备WebSearch功能,可调用外部工具进行网页搜索,辅助用户获取最新信息。

🚀Megrez-3B-Omni是全球首个端侧全模态理解开源模型,专为手机、平板等端侧设备设计,拥有30亿参数的黄金尺寸,结构规整,推理速度大幅提升。

🖼️Megrez-3B-Omni具备同时处理图片、音频和文本三种模态数据的能力,并在相关测评基准中取得最优性能,展现了强大的多模态理解能力。

🌐Megrez-3B-Instruct 纯语言版本模型特别提供了WebSearch功能,能智能判断何时调用外部工具进行网页搜索,辅助回答用户问题,有效解决小模型幻觉问题和知识储备不足的局限。

12月16日,无问芯穹宣布正式开源其“端模型+端软件+端IP”端上智能一体化解决方案中的小模型——全球首个端侧全模态理解开源模型Megrez-3B-Omni,并同步开源了纯语言版本模型Megrez-3B-Instruct。

据介绍,Megrez-3B-Omni是一个为端而生的全模态理解模型,选择了最适合手机、平板等端侧设备的30亿参数黄金尺寸,结构规整,推理速度最大领先同精度模型300%。作为一个全模态模型,Megrez-3B-Omni同时具备图片、音频、文本三种模态数据的处理能力,并在三个模态的多种测评基准中取得了最优性能。

凭借对硬件特性的深入理解与利用,Megrez-3B-Omni 通过软硬件协同优化策略,确保了各参数与主流硬件高度适配,以实现硬件性能的利用最大化。与上一代及其他端侧大语言模型相比,单模态版本的Megrez-3B-Instruct 在推理速度上取得了显著提升,最大推理速度可以领先同精度模型300%。

Megrez-3B-Instruct 这次还特别提供了WebSearch 功能,这一功能使得模型能够智能地判断何时需要调用外部工具进行网页搜索,辅助回答用户的问题。用户得以构建属于自己AI搜索,通过网络获取最新信息,克服小模型的幻觉问题和知识储备不足的局限。

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

端侧AI 全模态模型 开源模型 Megrez-3B WebSearch
相关文章