小米宣布开源声音理解大模型MiDashengLM-7B

动点科技 13小时前

小米宣布开源声音理解大模型MiDashengLM-7B

小米发布并开源MiDashengLM-7B模型，刷新多模态大模型成绩，提升计算效率，旨在终端设备上实现离线部署。

今天小米发布和全量开源了 MiDashengLM-7B 模型。MiDashengLM-7B 基于 Xiaomi Dasheng 作为音频编码器和 Qwen2.5-Omni-7B Thinker 作为自回归解码器，通过创新的通用音频描述训练策略，实现了对语音、环境声音和音乐的统一理解，声音理解性能在22个公开评测集上刷新多模态大模型最好成绩（SOTA），单样本推理的首 Token 延迟（TTFT）仅为业界先进模型的 1/4，同等显存下的数据吞吐效率是业界先进模型的 20 倍以上。

MiDashengLM 以 Xiaomi Dasheng 音频编码器为核心组件，是 Xiaomi Dasheng 系列模型的重要升级。在当前版本的基础上，小米已着手对该模型做计算效率的进一步升级，寻求终端设备上可离线部署，并完善基于用户自然语言提示的声音编辑等更全面的功能。

Fish AI Reader

AI辅助创作，多种专业模板，深度分析，高质量内容生成。从观点提取到深度思考，FishAI为您提供全方位的创作支持。新版本引入自定义参数，让您的创作更加个性化和精准。

FishAI

鱼阅，AI 时代的下一个智能信息助手，助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

小米模型开源音频处理

相关文章

百度副总裁的事儿挺火... 璩（qu）静凭借她自己的暴论短视频火上了几轮微博热搜，不近人情差点成了百度的“企业文化”，各种关于她的传播爆料齐出，经常被人们不...

小米与京东达成战略合作，目标三年达2000亿销售额

小米SU7先后出现刹车和启动故障，换车将优先排产

机构：一季度全球真无线耳机市场出货量达6500万，苹果出货量同比下滑8%但仍居第一

小米卫星通信软件著作权获批

小米登记卫星通信APP

中通快递：一季度调整后净利润22.24亿元，同比上涨15.8%

小米公司：小米大语言模型MiLM正式通过大模型备案

李彦宏：大模型的合作领域从手机向PC和电动汽车领域拓展

机构：一季度中国平板电脑市场出货量同比增长6.6%，华为市场份额居首