有没有能够识别语音并转换成“带有语音合成标记语言（SSML）”的文本的ai？

dog · 2023 年12 月 14 日 14:56

类似AI图生文，把图片还原成promote

有没有AI能把语音还原成promote的？

Yggdrasil-y · 2023 年12 月 14 日 23:15

OpenAI Whisper?

suliveevil · 2023 年12 月 20 日 07:27

还没见过自动打标记的，市面上都是STT。

dog · 2026 年4 月 10 日 10:38

Gemini现在可以，直接把音频发给它，然后指令：
请详细分析这段音频的音色、语速、情感状态，并将其转化为一段用于 TTS 生成的提示词（Prompt）或带 SSML 标签的文本

话题		回复	浏览量
寻一个文本转语音工具问题求助 ai , openai	5	1056	2024 年1 月 19 日
有没有什么开放的文字转语音语音转文字的api 问题求助	5	670	2023 年7 月 9 日
请问如何将大段音频转化为文字？问题求助	10	501	2025 年10 月 23 日
想做一个利用多模态大模型实现的 AI 视频总结，不知道现在有没有这样的应用了？闲聊灌水 ai	4	244	2025 年8 月 21 日
有没有照字幕文件语音合成、配音的软件/方式？问题求助	8	2425	2023 年2 月 21 日

有没有能够识别语音并转换成“带有语音合成标记语言 （SSML）”的文本的ai？