这有点超模,能直接声优出道了。现在国内的配音一个比一个尬。
但是我们可能不会开源视频里的这个版本,因为实在是使用了太多互联网数据,而且还做了sft,对于很多被train的人来说,有太多法律风险,也不公平。对于我们自己来说也没必要。
我们可能会从4w小时训练出来的底模开始,同时至少保证生成的结果能被开源的安全模型或者resemble.ai检测出来。4w小时的版本效果已经很好,只是网络小一些,稳定性差一些。
未来我们工作的重心也会放在高可控,水印和与llm的对接上。
所以, 应该是还没有开源. 而开源的似乎没有什么可用性.
但,
找到了一个部署, 可以参考下.
Fish Speech
开源最大文本转语音模型,基于VQ-GAN和Llama,VITS。
在线体验:Fish Speech
仓库地址:fish-speech
参考视频: 高质量AI音频生成!Fish-Speech懒人包(解压即用)!包涵推理与模型微调手把手教程!
1 个赞
更新了v1.3.5.2,最大的语音包zip有6GB。
可以尝鲜分角色朗读,不过通常只是造成混乱而已。
https://www.52pojie.cn/thread-1906366-1-1.html
大家是用什么程序调用的?
我用的是静读天下,操作上还是不如讯飞有声,毕竟不是专门用来听的。
里面这么多语音,大家觉得哪些比较好?
我想找一个嗲嗲的女声,实在是懒得一个个试了
找到了源头,最新版本是6-16更新的1.4.8(49)
2 个赞
试了一下,不同的版本间存在数据兼容的问题,也就是在更新版本后,导入的音源数据依旧存在于文件夹中但在新版本中无法显示,新版本也无法导入老版本的音源包。
提示里说了覆盖安装会有些问题,不过我导入了老版本最小的包,433MB的那个,还正常。