如何保存 Google Cloud Text-to-Speech AI 文字转语音服务为音频文件

原始链接在: 如何保存 Google Cloud Text-to-Speech AI 文字转语音服务为音频文件 - 小众软件

今天尝试了一下给视频配音,临时起意想找一款文字转语音服务,就找到了这个 Text-to-Speech AI,毕竟提供在线试用服务。发现可以很简单的将试用语音保存下来。@Appinn


最近有不少同学在 B 站给我们留言建议说加上配音,于是就有了配音。第一个带配音的视频在这里:Macify – 在 Chrome 新标签页显示 macOS 原生自带 4K 航拍屏保视频

Google Cloud Text-to-Speech AI

这只是一个网页试用服务,并不支持很多的字数进行文字转语音,并且语音朗读种类也没有 Azure 多,但试用一下还是可以的。

作为愿意付费的用户,青小蛙从0开始在寻找一款类似的服务,都试试看 😂

具体步骤就是:

  1. Google Cloud Text-to-Speech AI 输入文字试用
  2. 从浏览器导出 base64 编码的音频文件内容
  3. 使用在线服务(如 Base64 to MP3)将编码转换为 mp3

小视频(带字幕、配音)

青小蛙录制了一段简单的教程:

当然,结果是…由于 Azure 的语音服务过于丰富,目前可能会选择 Azure 来解决配音问题,Google Cloud Text-to-Speech AI 还是有点菜的…


原文:https://www.appinn.com/save-gcloud-text-to-speech-to-file/

蛙編你要文本生成語音可以用我寫的

自動通過 txt 生成語音和 srt 字幕文件,可以方便加入視頻。
需要一個 Azure api key,不過目前 Azure 注冊就有 12個月免費。

这个厉害了。能选角色和语气吗

还有时间轴咋处理啊

剪映或者 Capcut 试试?影视配音工作流非常方便。

Google Cloud 的 tts 服务绑卡之后每个月都有 100w 字符额度,wavenet 的效果还不错,我们业务上一直在用。

openai 的 tts api 感觉效果一般。

最真实的还是 11labs,免费用户有 1w 字符额度。但整体确实贵很多。

角色語氣要用微軟的 ssml 包一下文字,例如

<mstts:express-as style="sad" styledegree="2">
   快走吧,路上一定要注意安全,早去早回。
</mstts:express-as>

字幕時間軸是自動計算生成的。

最近看人在说 MiniMax 语音大模型,评论说中文比 Azure 效果好,还能复刻你想要的声音,不过也比 Azure 贵,好像万字 10 元的样子

如果装了node.js,可以用我写的azure tts命令行程序
在终端输入

npx node-edge-tts -t 'Hello world(替换为需要转换的文字)'

生成mp3文件,不需要api key

详见 GitHub - SchneeHertz/node-edge-tts: Use Microsoft Edge's TTS service on Node.js with support for proxy and subtitles.

这就是为什么我之前发帖问Azure云服务器是否好用的原因,主要是想顺带用一下语音合成