Stability AI 发布 Stable Audio 3.0：支持生成 6 分钟音乐

AI领域评论15字数 701阅读2分20秒阅读模式

Stability AI 正式推出音频生成模型全家桶——Stable Audio 3.0 人工智能公司 Stability AI 今日发布了全新音频生成模型系列 Stable Audio 3.0。其中旗舰模型可生成超过 6 分钟的专业级音乐作品。

四款模型覆盖从短音效到完整曲目的需求

Stability AI 本次共发布四个版本的模型：

Small SFX 和 Small 两款轻量模型面向端侧音效与音乐生成场景，支持最长 2 分钟内容；Medium 与 Large 则可创作完整曲目，时长达到 6 分 20 秒，相比 2024 年初的 Stable Audio 2.0 提升了一倍有余，并能保持音乐结构与旋律连贯性。

Small SFX、Small 和 Medium 三款模型已开放权重，允许任何人自由使用和修改。2024 年 Stability AI 曾发布 Stable Audio Open，最长仅支持 47 秒生成，新系列在这一点上实现了质的飞跃。

Large 型号仅通过 API 和自托管付费服务提供使用通道。此外，年营收超过 100 万美元的企业需另行购买企业授权。

值得注意的是，Google、ElevenLabs 等多家公司均在音乐生成领域持续投入，但 Suno 与 Udio 正在进行的版权诉讼表明，数据授权与唱片公司合作是此类服务长期存活的关键。

去年，Stability AI 已与华纳音乐集团和环球音乐集团达成合作，共同开发模型及音乐创作工具。公司表示，Stable Audio 3.0 完全基于授权数据训练构建。

Stability AI 正在秘密开发面向职业音乐人的新产品套件，但尚未透露更多细节。与此同时，前 Universal Audio 与 Fender 首席数字官 Ethan Kaplan 宣布加入 Stability AI，将主导该公司专业音乐产品的开发。

这一趋势并非孤例：Suno 已聘请前 Merlin CEO Jeremy Sirota 担任首席商务官；ElevenLabs 则从独立音乐发行商 Kobalt 挖来 Derek Cournoyer，担任音乐业务战略与法务主管。