Whisper JAX - 在线免费语音转文字工具,单文件 2 小时内免费使用

原始链接在: Whisper JAX - 在线免费语音转文字工具,单文件 2 小时内免费使用 - 小众软件

Whisper JAX 是一款基于 Whisper API 的在线语音转文字工具,支持麦克风、录音文件、YouTube 三种音频来源,单文件 2 小时以内免费使用。@Appinn


感谢 @地衣 的推荐。

地衣同学在群里求在线文本转语音工具,并扔出了这个说:「这个很好,但是限制两个小时」。

青小蛙觉得,限制两个小时已经很好了呀。 当然还有个缺点:「然后就是Whisper的老毛病,没有标点,不带时间戳就没法看」😂

针对这个缺点,其实可以考虑让 ChatGPT 加标点嘛。

Whisper JAX

Whisper JAX 托管在 Hugging Face 平台,直接在浏览器打开网页使用即可。

支持三种音频来源:

  • 麦克风
  • 音频文件
  • YouTube 链接

然后就可以等待转录啦:

用户量多的时候,需要排队。

这里还有一个翻译功能,不过仅支持翻译为英文。所以如果你是中文源音频,直接选择 transcribe 即可。勾选 Return timestamps 可以返回时间戳,格式与字幕文件的时间戳相同。

然后就…没什么了。

另外由于需要上传音频,隐私用户请谨慎考虑。

获取

原文:https://www.appinn.com/whisper-jax/

这个工具是开源的 GitHub - sanchit-gandhi/whisper-jax: JAX implementation of OpenAI's Whisper model for up to 70x speed-up on TPU.

在意隐私就自己 self-host 咯。

中文没标点,也没有分段,整个连成一行。我记得英文是有标点的,别的语言没有试过。
有些不到两个小时的音频也会报错。
还有,不知道能白嫖到什么时候。

刚试了一下,一段96分钟的演讲,转换出来是1991行,2.2万字。这么多丢给ChatGPT,手动操作要累死。
于是删掉时间戳丢给Claude,提示“请帮我给这篇文章加上标点,改正一些错别字,并适当分段,除此之外不要改变原文。”
效果似乎完美,出来很长一段,但是还没完。
继续提示“请继续。”
报错“We are unable to serve your request”

这个jax windows部署不了。windows本地运行最实用的faster-whisper,在线也有colab版。jax的colab版不知道为什么我用不了。

现在不用API最大的问题就是要对内容切片,这类工具还是推荐的太少,尤其是非插件类的,如果是一个单独的应用最好

long time no see

确实好久不见,不过我看到佳软再次出现才是震惊的,童年回忆啊,哈哈哈

更快的来了,不过输出格式有点不友好

阿里的通义听悟也不错,功能更丰富,暂时免费

可以看看这个,下载解压后双击 sp.exe, 菜单–工具–视频工具箱–语音识别为文字,免费开源无限制,可生成带时间戳的srt格式

1 个赞