速度最快：Stable Audio Open Small 端侧音频模型登场，手机上 8 秒内 AI 生成 11 秒音频

IT之家 05月15日 09:28

../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

Stability AI 推出了 Stable Audio Open Small，一款可在智能手机上运行的音频生成 AI 模型。与 Suno 和 Udio 等竞品不同，该模型无需云端处理，能在不到 8 秒内生成最长 11 秒的音频片段，适用于快速制作音效。Stability AI 与 Arm 合作优化，确保模型在手机上离线运行，并使用免版税音频库训练。目前，该模型仅支持英文提示，生成歌声或高质量歌曲的能力有限，且使用条款对不同用户群体有所区分。

🎧 Stable Audio Open Small 是 Stability AI 推出的音频生成 AI 模型，主打在智能手机上流畅运行，无需依赖云端。

⏱️ 该模型能够在不到 8 秒的时间内，在手机上生成最长 11 秒的音频片段，主要用于快速制作鼓点或乐器片段等音效。

📱 为了实现手机端离线运行，Stability AI 与芯片制造商 Arm 合作，针对 Arm CPU 进行了特别优化。

📚 在训练数据集方面，Stable Audio Open Small 使用来自 Free Music Archive 和 Freesound 的免版税音频库，规避了版权风险。

⚠️ 现阶段，该模型仅支持英文提示，无法生成逼真的歌声或高质量歌曲。此外，使用条款对不同用户群体有所区分，年收入低于 100 万美元的企业可免费使用，超过此门槛的开发者或组织需购买企业许可证。

IT之家 5 月 15 日消息，科技媒体 TechCrunch 昨日（5 月 14 日）发布博文，报道称 AI 初创公司 Stability AI 推出 Stable Audio Open Small，号称是市场上速度最快的“立体声”音频生成 AI 模型，可在智能手机上运行。

相比较 Suno 和 Udio 等其他 AI 音频应用，Stable Audio Open Small 无需依赖云端处理，其高效设计让它能在智能手机上流畅运行。Stability AI 表示，该模型能在不到 8 秒的时间内，在手机上生成最长 11 秒的音频片段，适用于快速制作鼓点或乐器片段等音效。

在训练方面，Stability AI 携手芯片制造商 Arm，针对 Arm CPU 特别优化，可以在智能手机上离线运行；在训练数据集方面，不同于 Suno 和 Udio 等竞争对手（据称使用了含版权内容的数据，存在知识产权风险），全部来自 Free Music Archive 和 Freesound 免版税音频库。

IT之家注：现阶段 Stable Audio Open Small 仅支持英文提示，无法生成逼真的歌声或高质量歌曲，且由于训练数据偏向西方风格，不同音乐类型的表现参差不齐。

此外使用条款较为严格：研究人员、爱好者及年收入低于 100 万美元的企业可免费使用，但超过这一收入门槛的开发者或组织需购买 Stability AI 的企业许可证。

Fish AI Reader

FishAI

联系邮箱 441953276@qq.com

相关标签