语音转录工具，类似青小蛙之前推的buzz，但是使用GPU速度更快

JoeCubber · 2023 年3 月 11 日 00:10

功能：

测试速度：

JoeCubber · 2023 年3 月 11 日 02:38

翻译成英语。

官方给的转录错误率表。得分越低，转录效果越好。

dray · 2023 年3 月 11 日 03:31

确实，英语口语不好的人很抓瞎。
不过也能从侧面练习英语的吧

Qingwa · 2023 年3 月 11 日 03:55

可以可以。

看起来，GPU 真的是居家必备啊，不然…AI 和你说再见

JoeCubber · 2023 年3 月 11 日 04:05

简单拿双截棍测试了下。

只能说这个翻译目前很迷。如果是普通语音，是可以翻译出一些文本的。不知道为什么歌词里面全部变成[Music]

dawn · 2023 年3 月 11 日 04:35

youtube的翻译也是音乐直接显示music，感觉可能是用的同一种逻辑：音乐就是音乐，不需要翻译

lilyhcn1 · 2023 年3 月 11 日 05:12

这个我也调试通了，只不过只会命令行，用python就不会输出了。本想搞成接口分享给大家的。
效果还是不错了，但还有改进的空间，用large模型跑真是太慢了

JoeCubber · 2023 年3 月 11 日 08:28

作者说只测试了medium版本。不过我用medium有时也遇到重复结果。

yabeyond · 2023 年3 月 12 日 14:10

有没软件支持声纹识别的，就是区分不同的人发言。国内都是要在线上传，比如字节跳动那款，想要离线的。

alenh · 2023 年3 月 12 日 14:34

中文还是比较弱

otones · 2023 年3 月 13 日 01:29

字幕组应该很喜欢，可以生成带时间轴的文本，省了不少事情呀

Baiyssy · 2023 年3 月 13 日 02:59

集成显卡也能用，当然很慢，不过好处是不占用CPU，机子不会卡

274b651812dd7588f586 · 2023 年3 月 13 日 03:43

准确度还可以，居然对粤语识别也还行。只是为什么我转换出的全是繁体中文，语言里没有简体可以选。

lilyhcn1 · 2023 年3 月 13 日 04:22

命令行是中文，python是繁体。

也可能是我没找对命令。

Baiyssy · 2023 年3 月 13 日 05:00

离线语音识别现在真的还需要这么大的算力吗？为什么在12核的i5-12500上跑的还是这么费劲呢？讯飞输入法的离线语音识别在小小的手机上就可以跑得很准确，OpenAI的Whisper模型在PC上跑出来的效果也并没有好多少。

dandychow · 2023 年12 月 20 日 01:34

实时转写怎么弄，有弄过吗？

Baiyssy · 2023 年12 月 20 日 09:28

你这个题目难度也忒高了点儿
我强烈怀疑如果周杰伦没唱过这个，他自己也听不懂

话题		回复	浏览量
简易的 Whisper 客户端，使用 OpenAI API 进行语音转文字青蛙的应用	5	1955	2023 年12 月 20 日
【自荐】VideoCaptioner - 基于 LLM 的智能视频字幕助手，支持生成、断句、优化、翻译全流程，一键高质量字幕视频合成！发现频道 🔎	12	470	2024 年11 月 15 日
有没有什么开放的文字转语音语音转文字的api 问题求助❓	5	536	2023 年7 月 9 日
Buzz：离线语音转文字（字幕），实时语音识别，基于 OpenAI Whisper 发现频道 🔎 appinned , windows , ai , stt	33	22672	2024 年2 月 28 日
求好用的语音识别的开源软件，我想自己布署问题求助❓	4	1835	2023 年2 月 12 日