找到几个都是文本转指定克隆音色的,有没有支持mp3/wav输入的。
自己有显卡或有条件运行的话 开源的其实很多 随便一搜就有
GitHub - babysor/MockingBird: 🚀AI拟声: 5秒内克隆您的声音并生成任意语音内容 Clone a voice in 5 seconds to generate arbitrary speech in real-time
和
GPT-SoVITS/docs/cn/README.md at main · RVC-Boss/GPT-SoVITS · GitHub
这两个貌似也是 文本转语音吧,不是语音转变音色。
文本转语音这类,很多地方重音会读错,听起来很怪异。我需要的是自己读完,然后转变音色。
不是很确定楼主所说的「自定义音色」是想要什么样的效果。
从音乐制作角度来说,「自定义音色」,或者「声音设计」一般就是使用 DAW(数字音频工作站),比如 Logic Pro, Reaper, Pro Tools 等这些,然后加入自己的音频(就是 MP3、WAV 这些),然后你可以使用 DAW 自带的插件或者是另外购买的插件,通过变调、EQ、压缩、过载、失真、延迟、混响等,做出自己想要的音色。也可以将录音作为采样(sample)然后使用软件合成器改造声音。
音频插件的话,门路就很多了…需要注意的避免厂商营销诱惑,为相同的效果重复付费。可以搜索一下 free vst , free synth 等找一些免费插件试一下。一般 DAW 都有自带一些。Logic Pro 自带的合成器就挺强大的(但 Logic Pro 本身需要付费)。
有一些音频修复软件或者是母带制作软件,也可以不需要 DAW 而单独使用,比如 iZotope RX,IK Multimedia T-RackS 这种。但这种软件可能只能限定使用该软件中内置的插件做声音处理。
如果你是苹果电脑用户,可以直接在商店下载库乐队(GarageBand,Logic Pro 的简化版),然后用自带的效果进行一些尝试。老 Windows 用户可能比较知道的是 Adobe Audition (付费)和 Audacity(免费).
另外不管是 MacOS 还是 Windows,都可以下载 BalckMagic DaVinci Resolve 的免费版,使用其中的 Fairlight 部分来进行音频处理。需要注意的是,Fairlight 本身是设计给影视行业用的,所以音频处理上的一些逻辑和前述 DAW 以立体声/单声道聆听为主的音乐音频处理不一样(比如 Fairlight 默认的 Pan 不是简单的左右声道,还包括了前后方位)。
当然有钱和地方的话,还可以直接买硬件效果器和合成器…
简单来说就是 柯南变声器 一样的软件。
比如截取一段孙悟空声音放在软件里,然后录制一段自己的声音朗读的文案,就可以把自己朗读的mp3变成孙悟空声音的mp3。
傻瓜式的方案我不知道。创新 SoundBlaster 系列 DAC 的配套软件有提供类似功能,并且是实时变音色,但音色有限(比如只是老人、女性、机器人、魔鬼这种)。
前面说的 DAW 配合插件、软件合成器的玩法更多,可能可以实现想要或接近的效果。