Z Potentials 05月15日 13:11
速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

Stability AI发布了Stable Audio Open Small,一款高效快速的音频生成AI模型,能在智能手机上运行。该模型与Arm合作,优化边缘计算效率,降低硬件需求。训练数据来自免版税音频库,避免了版权风险。尽管模型仅支持英文提示,且无法生成逼真的人声或高质量歌曲,但在快速生成短音频样本和音效方面表现出色。该模型对小型开发者免费,但对大型企业有许可限制。Stability AI希望借此模型扭转公司颓势。

📱Stable Audio Open Small模型是Stability AI与Arm合作的成果,优化了在移动设备上的运行效率,使得音频生成可以在智能手机等设备上实现。

🎵该模型的训练数据全部来自免版税音频库Free Music Archive和Freesound,避免了潜在的知识产权风险,这与其它一些使用受版权保护内容训练的模型形成对比。

💰Stable Audio Open Small针对不同用户群体有不同的使用条款:年收入低于100万美元的研究人员、爱好者和企业可以免费使用,但年收入超过100万美元的开发者需要购买企业许可证。

⚠️该模型存在一些局限性,例如仅支持英文提示输入,无法生成逼真的人声或高质量歌曲,且由于训练数据偏向西方风格,在不同音乐类型上的表现可能不均衡。

techcrunch 2025-05-15 11:31 北京

该模型通过与Arm合作,利用KleidiAI库优化边缘计算效率,显著降低硬件需求,模型训练数据全部来自免版税音频库Free Music Archive和Freesound。

图片来源:Stability AI

AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型,该公司宣称这是市场上速度最快的模型,且效率高到足以在智能手机上运行。

Stable Audio Open Small 是 Stability AI 与芯片制造商 Arm 合作的成果,后者生产了众多平板、手机及其他移动设备中的处理器。尽管已有许多 AI 应用如 Suno 和 Udio 能生成音频,但多数依赖云端处理,意味着无法离线使用。

Stability 还宣称,Stable Audio Open Small 的训练集完全由免版税音频库 Free Music Archive 和 Freesound 中的歌曲构成。这与前述 Suno 和 Udio 的训练集形成对比——据报道后者包含受版权保护内容,存在知识产权风险。

Stable Audio Open Small 拥有 3.41 亿参数规模,并针对 Arm CPU 进行了优化。(参数有时被称为"权重",是模型内部决定其行为的关键组件。)该模型专为快速生成短音频样本和音效(如鼓点与乐器即兴片段)设计。

Stability AI 宣称其能在智能手机上以不到 秒的时间生成最长 11 秒的音频。

该模型并非没有局限性。Stable Audio Open Small 仅支持英文提示输入,Stability 在其文档中指出,该模型无法生成逼真的人声或高质量歌曲。公司还警告称,由于训练数据偏向西方风格,模型在不同音乐类型上的表现并不均衡。

对于开发者而言,另一个潜在的难题是Stable Audio Open Small 的使用条款较为严格。该模型对年收入低于 100 万美元的研究人员、爱好者和企业免费开放,但年收入超过 100 万美元的开发者及组织需购买 Stability 的企业许可证。

Stability 是热门图像生成模型 Stable Diffusion 背后的困境公司,去年在包括埃里克·施密特和 Napster 创始人肖恩·帕克在内的投资者试图扭转业务颓势时筹集了新资金。据报道,Stability 的联合创始人兼前 CEO 埃马德·莫斯塔克管理不善,导致公司陷入财务困境,员工辞职,与 Canva 的合作破裂,投资者对公司前景日益担忧。

过去几个月里,Stability 聘请了新 CEO,任命电影制作人詹姆斯·卡梅隆加入董事会,并发布了多款新的图像生成模型。

参考资料

https://techcrunch.com/2025/05/14/stability-ai-releases-an-audio-generating-model-that-can-run-on-smartphones/

编译:ChatGPT

-----------END-----------

🚀 我们正在招募新一期的实习生

🚀 我们正在寻找有创造力的00后创业者

关于Z Potentials

阅读原文

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

Stable Audio Open Small 音频生成 Stability AI Arm 边缘计算
相关文章