求小伙伴们分享一下以下这几个AI文字转语音(中文)并且可训练声音的平台之间的优劣以及其它信息

Google Cloud Text-to-Speech:

  • 提供高质量的语音合成功能。
  • 支持多种语言和语音。
  • 通过AutoML可以训练定制化的语音模型。

Amazon Polly:

  • 提供多种自然的语音。
  • 支持SSML(语音合成标记语言)以自定义输出。
  • 可以使用Neural TTS生成更自然的声音。

Microsoft Azure Cognitive Services:

  • 提供丰富的语音合成选项。
  • 支持自定义语音功能(Custom Voice),可以训练个性化的语音模型。
  • 有强大的API和文档支持。

IBM Watson Text to Speech:

  • 提供高质量的TTS服务。
  • 支持定制化语音训练。
  • 易于集成和使用。

Descript:

  • 提供音频和视频编辑功能,包括TTS。
  • 支持Overdub功能,可以克隆声音并生成新的音频内容。

Resemble AI:

  • 专注于语音克隆和自定义TTS。
  • 提供多种语言支持。
  • 可以训练个性化的语音模型。

Voxygen:

  • 提供专业的TTS服务。
  • 支持多种语言和不同风格的声音。
  • 可定制化的声音模型训练。

如果还有别的平台也可以分享一下,谢谢大家

没有最好的,只有最合适的。

要有最好的,为什么还会有其他家的存在。。。

我比较想知道他们对中文的支持程度,尝试了一下Resemble AI,应该用的是新的ai路子,只能生成老外口音的中文,而且吞字严重,可以说是完全不支持中文 :joy:

我用过 Azure 还是比较好的。角色非常丰富,还有语气风格可选。

好的哦,谢谢老哥“排雷”

一直在用的一些第三方,接口都是Azure的,听多了有点腻,所以想着有没有其他差不多水平的可以用 :face_exhaling:

之前有个 ChatTTS的Demo超级牛,完全和真人一样,会自己加尬笑之类的语气
可惜太像真人聊天的语气了,没办法拿来配音 :joy:

聊一下我们商用感受 :
11labs,效果最好,价格最贵
OpenAI:定制性较差,不如 app 惊艳
google cloud:11labs 出来之前的产品,还行,胜在免费 100w 字符量

2 Likes

你这需求是不是必须提供 API 第三方调用?

应该不用,不过后面想想目前还是先拿个开源模型用着试试

还兼容其他的,比如 * GPT-SoVITS的模型

ChatTTS UI

1 Like

谢谢啦,选择用GPT-SoVITS尝试一下先