6月6日的IT House, Stability AI新闻,以稳定传播图形模型为基础,随着稳定音频开放的启动,进一步扩展到音频领域,这可以产生高质量的音频样本,以用户输入的提示词为基础。
稳定的音频开放可以创造最多47秒的音乐,非常适合鼓、音乐旋律、环境稳健和语法声音效应,开放源码模式以变换扩散模型为基础,在自动编码器的潜在空间运行,并提高音频生产的质量和多样性。
稳定音频开放现已开放,链接与信息技术之家相连,有兴趣的用户可以在Huggingface上测试。 据说它使用FreeSound和免费音乐档案馆等音乐图书馆的486,000个样本进行培训。
大赦国际指出: " 虽然它可以制作简短的音乐剪辑,但它不适合完整的歌曲、旋律或人的声音 " 。
稳定音频开放与稳定音频2.0不同,它是一种开放源码模式,侧重于简短音频剪辑和音效,后者可制作全音频长达3分钟。
注册有任何问题请添加 微信:MVIP619 拉你进入群
打开微信扫一扫
添加客服
进入交流群
发表评论