
Stability AI 正式推出音频生成模型全家桶——Stable Audio 3.0 人工智能公司 Stability AI 今日发布了全新音频生成模型系列 Stable Audio 3.0。其中旗舰模型可生成超过 6 分钟的专业级音乐作品。
四款模型覆盖从短音效到完整曲目的需求
Stability AI 本次共发布四个版本的模型:
| 版本 | 参数规模 | 生成时长 | 可用性 |
|---|---|---|---|
| Small SFX | 4.59 亿 | 较短音效 | 开放权重 |
| Small | 4.59 亿 | 最长 2 分钟 | 开放权重 |
| Medium | 14 亿 | 6 分 20 秒 | 开放权重 |
| Large | 27 亿 | 6 分 20 秒 | API / 付费自托管 |
Small SFX 和 Small 两款轻量模型面向端侧音效与音乐生成场景,支持最长 2 分钟内容;Medium 与 Large 则可创作完整曲目,时长达到 6 分 20 秒,相比 2024 年初的 Stable Audio 2.0 提升了一倍有余,并能保持音乐结构与旋律连贯性。
Small SFX、Small 和 Medium 三款模型已开放权重,允许任何人自由使用和修改。2024 年 Stability AI 曾发布 Stable Audio Open,最长仅支持 47 秒生成,新系列在这一点上实现了质的飞跃。
Large 型号仅通过 API 和自托管付费服务提供使用通道。此外,年营收超过 100 万美元的企业需另行购买企业授权。
音乐版权:AI 音乐生成商的生死线
值得注意的是,Google、ElevenLabs 等多家公司均在音乐生成领域持续投入,但 Suno 与 Udio 正在进行的版权诉讼表明,数据授权与唱片公司合作是此类服务长期存活的关键。
去年,Stability AI 已与华纳音乐集团和环球音乐集团达成合作,共同开发模型及音乐创作工具。公司表示,Stable Audio 3.0 完全基于授权数据训练构建。
专业产品线加速:前 Universal Audio 高管加盟
Stability AI 正在秘密开发面向职业音乐人的新产品套件,但尚未透露更多细节。与此同时,前 Universal Audio 与 Fender 首席数字官 Ethan Kaplan 宣布加入 Stability AI,将主导该公司专业音乐产品的开发。
这一趋势并非孤例:Suno 已聘请前 Merlin CEO Jeremy Sirota 担任首席商务官;ElevenLabs 则从独立音乐发行商 Kobalt 挖来 Derek Cournoyer,担任音乐业务战略与法务主管。


评论