Buzz:离线语音转文字(字幕),实时语音识别,基于 OpenAI Whisper

软件名称

Buzz

功能简介

实时语音转文字、实时翻译(需麦克风权限)

导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)

应用平台

Windows/Unix/macOS

推荐类型

用户推荐

官网

碎碎念

相较于 Autocut 功能更单一,专注于语音转文字、字幕生成。

相较于命令行 Python 版 Whisper 速度更快,有 GUI 对普通用户更友好。

5 Likes

非常喜欢此类应用的,感谢分享

不客气,能帮到你就好。 :stuck_out_tongue_closed_eyes:

怎么部署,对python不是很了解

1 Like

直接下载 App,不用命令行部署,不然我也不会推荐啊。绝大部分人不会命令行。

1 Like

好耶!正好前几天装 Whisper 装了半天没装上,来试试这个

image

请问,这两个有什么区别嘛

试了一下,如果转成txt的话就完全没有标点,这一点特别奇怪。

转换粤语老歌 沉默是金.mp3 的效果,前面是转换出来的,后面是网上找的歌词。用的High,转换速度很慢。
“词曲 李宗盛”这几个字不知道怎么出来的,mp3文件的文件名、ID3标签都没有这个信息。实际上这首歌的词是许冠杰,曲是张国荣。

一风岚岚 词曲 李宗盛
一风岚岚 独回忘旧事前尘 夜风凛凛 独回望旧事前尘
是以往的我 充满劳烦 是以往的我 充满怒愤
诬告与指责 即压着满土气不忿 诬告与指责 积压着满肚气不愤
对厌言 反应 甚为着紧 对谣言反应 甚为着紧
受了交分 不停输定的痴人 受了教训 得了书经的指引
言已看得透 不再自困 现已看得透 不再自困
难得有分寸 不再像以往那官兵 但觉有分数 不再像以往那般笨
没泪痕 轻快笑着笑 抹泪痕 轻快笑着行
明明终都早注定你不划勤 冥冥中都早注定你富或贫
是错永不对 真永是真 是错永不对 真永是真
任你斩输 安守我本份 任你怎说安守我本份
始终相信 沉默是非 始终相信 沉默是金
是非有功力 实现我无法别人 是非有公理 慎言莫冒犯别人
如想冷风雨 又太认真 遇上冷风雨休太认真
自信满心里 忧你无好次与质问 自信满心里 休理会讽刺与质问
笑卖有人 假脱地做人 笑骂由人 洒脱地做人
受了交分 不停输定的痴人 受了教训 得了书经的指引
言已看得透 不再自困 现已看得透 不再自困
难得有分寸 不再像以往那官兵 但觉有分数 不再像以往那般笨
没泪痕 轻快笑着笑 抹泪痕 轻快笑着行
笑得不得不 笑得不得
笑得不得不 笑得不得不
不再像以往那官兵 没泪痕
轻快笑着笑
明明终都早注定你不划勤 冥冥中都早注定你富或贫
是错永不对 真永是真 是错永不对 真永是真
任你斩输 安守我本份 任你怎说安守我本份
始终相信 沉默是非 始终相信 沉默是金
是非有功力 实现我无法别人 是非有公理 慎言莫冒犯别人
如想冷风雨 又太认真 遇上冷风雨休太认真
自信满心里 忧你无好次与质问 自信满心里 休理会讽刺与质问
笑卖有人 假脱地做人 笑骂由人 洒脱地做人
笑卖人 假脱地做人 少年人 洒脱地做人
继续笑 沙条了做人 继续行 洒脱地做人

感谢分享 遇到问题了 请问大佬们怎么解决
20221124123749

相较于命令行 Python 版 Whisper 速度更快

这个需要参见 GitHub - chidiwilliams/buzz: Buzz transcribes and translates audio offline on your personal computer. Powered by OpenAI's Whisper. ,跟提到的buzz其实没啥关系。

效果有点差强人意,low 和 very low 几乎完全不能用 (转完人都傻了,怎么和我录的完全是两个东西),正确率甚至不如微软 OneNote 的听写 (至少偶尔几个字是对的),另外两个慢得要死

不过对于某些机械声明显,语音匀速,无背景噪声的还是能完整转出来的,好歹算有个能离线用的了

我用very low识别了一个星际2的英文解说视频,相当准确,但另一个中文解说视频识别出来就没法看了

应该没有吧,只是一个直接下载运行,一个是压缩包。
我没有 Windows,不太清楚。

老外的东西,处理中文有点费劲可以理解,不过凭空多出来的信息倒是有点意思。

好吧,其实我也不懂命令行还有 Python C++ 什么的。 :joy:

不管怎么说,这个粤语听力比我是强太多了。
再无聊的时候拿娄底话试试

1 Like

最大的问题还是性能,太慢了。可能是我的笔记本落伍了(R5 3550H+16GB DDR4)

win7是不是不能用?我看是python39编译的,我这里下载windows版本的跑起来各种错误

那就要找开发者问问了,不过应该没人愿意单独维护一个退役系统的兼容性。