jameon512
(okaymyworld)
1
项目开源地址: GitHub - jianchang512/clone-voice: A sound cloning tool with a web interface, using your voice or any sound to record audio / 一个带web界面的声音克隆工具,使用你的音色或任意声音来录制音频
这是一个声音克隆工具,可使用你的或者其他声音的音色,将一段文字合成为使用该声音说话的音频。
使用非常简单,没有 GPU 也可以使用,github 下载预编译版本,双击 app.exe 打开一个 web 界面,鼠标点点快速体验,笔记本电脑就可使用,。
支持 中文、英文、日语、韩语 4 种语言,可在线从麦克风录制声音。
为保证合成效果,建议录制时长 5 秒到 20 秒,发音清晰准确,不要存在背景噪声。
英文效果很棒,中文效果还凑合,下载体验下吧
集成 flask 搞了一个简单的本地 web 界面,可在线录制声音或上传已有的一段声音作为音色,然后输入一段文字,即可生成使用该声音的音频。
目前支持中、英、日、韩 四种语言,英文效果最棒,中文勉强吧。
已提供预编译版,window 上下载压缩包解压,双击 run.bat 即可使用。
其实直接拉取 coqui-tts 也可以,本项目基本只是一个 coqui-tts 的简单包装,没多大技术含量,初衷是降低 ai 使用难度,让小白快速上手体验,不必配备 N 卡,即使笔记本也可使用。
2 个赞
Bak3c
(生 陈)
2
用日文会提示‘no module named 'cutlet’
Qingwa
(青小蛙)
3
这个装一下就行吧:
pip install cutlet
jameon512
(okaymyworld)
5
更新了一下
目前支持:使用特定人声或者自己录制的声音,使用该音色将文字合成为声音,或者将一个音频文件转为另一个。
使用了一下,感觉这对性能的要求已经算很低很低的了,我用 7-8 年前的电脑,只有核显,除了刚开始有点慢,之后还是能跑的,虽然没有啥语气,但对于老电脑来说,能跑就行,还要什么自行车
jameon512
(okaymyworld)
8
一般音色克隆工具部署是个老大难,所以搞了个简单的,笔记本都可以用。
1 个赞