如何保存 Google Cloud Text-to-Speech AI 文字转语音服务为音频文件

Qingwa · 2023 年11 月 29 日 05:19

原始链接在：如何保存 Google Cloud Text-to-Speech AI 文字转语音服务为音频文件 - 小众软件

今天尝试了一下给视频配音，临时起意想找一款文字转语音服务，就找到了这个 Text-to-Speech AI，毕竟提供在线试用服务。发现可以很简单的将试用语音保存下来。@Appinn

最近有不少同学在 B 站给我们留言建议说加上配音，于是就有了配音。第一个带配音的视频在这里：Macify – 在 Chrome 新标签页显示 macOS 原生自带 4K 航拍屏保视频。

Google Cloud Text-to-Speech AI

这只是一个网页试用服务，并不支持很多的字数进行文字转语音，并且语音朗读种类也没有 Azure 多，但试用一下还是可以的。

作为愿意付费的用户，青小蛙从0开始在寻找一款类似的服务，都试试看 😂

具体步骤就是：

Google Cloud Text-to-Speech AI 输入文字试用
从浏览器导出 base64 编码的音频文件内容
使用在线服务（如 Base64 to MP3）将编码转换为 mp3

小视频（带字幕、配音）

青小蛙录制了一段简单的教程：

https://www.bilibili.com/video/BV1xC4y1y7xp

当然，结果是…由于 Azure 的语音服务过于丰富，目前可能会选择 Azure 来解决配音问题，Google Cloud Text-to-Speech AI 还是有点菜的…

原文：https://www.appinn.com/save-gcloud-text-to-speech-to-file/

Hoothin · 2023 年11 月 29 日 06:14

蛙編你要文本生成語音可以用我寫的

github.com

hoothin/AIApplications/blob/main/tts.py

# -*- coding: utf-8 -*-
"""
Author: Hoothin
调用微软官网的API，生成文本合成语音
"""
import os
import sys
import re
import requests
import time
from xml.etree import ElementTree
from pydub import AudioSegment

# 微软TTS的API key
subscription_key = ""
server_local = "japaneast"
input_path = "data/words.txt"
result_path = "merged_audio"

"""

此文件已被截断。显示原始文件

自動通過 txt 生成語音和 srt 字幕文件，可以方便加入視頻。
需要一個 Azure api key，不過目前 Azure 注冊就有 12個月免費。

Qingwa · 2023 年11 月 29 日 07:12

这个厉害了。能选角色和语气吗

还有时间轴咋处理啊

zhanglixing · 2023 年11 月 29 日 07:27

剪映或者 Capcut 试试？影视配音工作流非常方便。

Google Cloud 的 tts 服务绑卡之后每个月都有 100w 字符额度，wavenet 的效果还不错，我们业务上一直在用。

openai 的 tts api 感觉效果一般。

最真实的还是 11labs，免费用户有 1w 字符额度。但整体确实贵很多。

Hoothin · 2023 年11 月 29 日 07:29

角色語氣要用微軟的 ssml 包一下文字，例如

<mstts:express-as style="sad" styledegree="2">
   快走吧，路上一定要注意安全，早去早回。
</mstts:express-as>

字幕時間軸是自動計算生成的。

Puteulanus · 2023 年11 月 29 日 11:32

最近看人在说 MiniMax 语音大模型，评论说中文比 Azure 效果好，还能复刻你想要的声音，不过也比 Azure 贵，好像万字 10 元的样子

Seldon_Horizon · 2023 年11 月 29 日 11:37

如果装了node.js，可以用我写的azure tts命令行程序
在终端输入

npx node-edge-tts -t 'Hello world(替换为需要转换的文字)'

生成mp3文件，不需要api key

详见 GitHub - SchneeHertz/node-edge-tts: Use Microsoft Edge's TTS service on Node.js with support for proxy and subtitles.

skystar · 2023 年12 月 1 日 06:42

这就是为什么我之前发帖问Azure云服务器是否好用的原因，主要是想顺带用一下语音合成

话题		回复	浏览量
求小伙伴们分享一下以下这几个AI文字转语音（中文）并且可训练声音的平台之间的优劣以及其它信息问题求助	10	626	2024 年7 月 15 日
简易的 Whisper 客户端，使用 OpenAI API 进行语音转文字青蛙的应用	5	2216	2023 年12 月 20 日
寻一个文本转语音工具问题求助 ai , openai	5	1051	2024 年1 月 19 日
Whisper JAX - 在线免费语音转文字工具，单文件 2 小时内免费使用青蛙的应用	9	2390	2023 年11 月 21 日
结合微软逼真语音合成，我做了一个微信公众号文章朗读功能讨论分享小程序	8	798	2024 年4 月 21 日

如何保存 Google Cloud Text-to-Speech AI 文字转语音服务为音频文件

Google Cloud Text-to-Speech AI

小视频（带字幕、配音）

相关话题