Stability AI 发布 Stable Audio 3.0:支持生成 6 分钟音乐

内容管家 AI领域评论10字数 701阅读2分20秒阅读模式
Stability AI 发布 Stable Audio 3.0:支持生成 6 分钟音乐

Stability AI 正式推出音频生成模型全家桶——Stable Audio 3.0 人工智能公司 Stability AI 今日发布了全新音频生成模型系列 Stable Audio 3.0。其中旗舰模型可生成超过 6 分钟的专业级音乐作品。

四款模型覆盖从短音效到完整曲目的需求

Stability AI 本次共发布四个版本的模型:

版本 参数规模 生成时长 可用性
Small SFX 4.59 亿 较短音效 开放权重
Small 4.59 亿 最长 2 分钟 开放权重
Medium 14 亿 6 分 20 秒 开放权重
Large 27 亿 6 分 20 秒 API / 付费自托管

Small SFX 和 Small 两款轻量模型面向端侧音效与音乐生成场景,支持最长 2 分钟内容;Medium 与 Large 则可创作完整曲目,时长达到 6 分 20 秒,相比 2024 年初的 Stable Audio 2.0 提升了一倍有余,并能保持音乐结构与旋律连贯性。

Small SFX、Small 和 Medium 三款模型已开放权重,允许任何人自由使用和修改。2024 年 Stability AI 曾发布 Stable Audio Open,最长仅支持 47 秒生成,新系列在这一点上实现了质的飞跃。

Large 型号仅通过 API 和自托管付费服务提供使用通道。此外,年营收超过 100 万美元的企业需另行购买企业授权。

音乐版权:AI 音乐生成商的生死线

值得注意的是,Google、ElevenLabs 等多家公司均在音乐生成领域持续投入,但 Suno 与 Udio 正在进行的版权诉讼表明,数据授权与唱片公司合作是此类服务长期存活的关键。

去年,Stability AI 已与华纳音乐集团和环球音乐集团达成合作,共同开发模型及音乐创作工具。公司表示,Stable Audio 3.0 完全基于授权数据训练构建。

专业产品线加速:前 Universal Audio 高管加盟

Stability AI 正在秘密开发面向职业音乐人的新产品套件,但尚未透露更多细节。与此同时,前 Universal Audio 与 Fender 首席数字官 Ethan Kaplan 宣布加入 Stability AI,将主导该公司专业音乐产品的开发。

这一趋势并非孤例:Suno 已聘请前 Merlin CEO Jeremy Sirota 担任首席商务官;ElevenLabs 则从独立音乐发行商 Kobalt 挖来 Derek Cournoyer,担任音乐业务战略与法务主管。

延伸阅读

 
内容管家

发表评论