当前声音最接近真人的中文本地tts是什么?

这有点超模,能直接声优出道了。现在国内的配音一个比一个尬。

github

但是我们可能不会开源视频里的这个版本,因为实在是使用了太多互联网数据,而且还做了sft,对于很多被train的人来说,有太多法律风险,也不公平。对于我们自己来说也没必要。

我们可能会从4w小时训练出来的底模开始,同时至少保证生成的结果能被开源的安全模型或者resemble.ai检测出来。4w小时的版本效果已经很好,只是网络小一些,稳定性差一些。

未来我们工作的重心也会放在高可控,水印和与llm的对接上。

所以, 应该是还没有开源. 而开源的似乎没有什么可用性.

但,

找到了一个部署, 可以参考下.

Fish Speech
开源最大文本转语音模型,基于VQ-GAN和Llama,VITS。
在线体验:Fish Speech
仓库地址:fish-speech
参考视频: 高质量AI音频生成!Fish-Speech懒人包(解压即用)!包涵推理与模型微调手把手教程!

1 个赞

更新了v1.3.5.2,最大的语音包zip有6GB。
可以尝鲜分角色朗读,不过通常只是造成混乱而已。
https://www.52pojie.cn/thread-1906366-1-1.html
大家是用什么程序调用的?
我用的是静读天下,操作上还是不如讯飞有声,毕竟不是专门用来听的。
里面这么多语音,大家觉得哪些比较好?
我想找一个嗲嗲的女声,实在是懒得一个个试了

找到了源头,最新版本是6-16更新的1.4.8(49)

2 个赞

试了一下,不同的版本间存在数据兼容的问题,也就是在更新版本后,导入的音源数据依旧存在于文件夹中但在新版本中无法显示,新版本也无法导入老版本的音源包。

提示里说了覆盖安装会有些问题,不过我导入了老版本最小的包,433MB的那个,还正常。