CapsWriter-Offline，可能是最好用的 PC 端语音输入工具（离线识别）

HaujetZhao · 2023 年5 月 28 日 09:23

CapsWriter-Offline

按住 CapsLock 或鼠标X2 说话，松开就上屏。就这么简单。

CapsWriter-Offline 是一个专为 Windows 打造的完全离线语音输入工具。

CapsWriter-Offline 的精髓在于：完全离线（不受网络限制）、响应极快、高准确率 且 高度自定义。我追求的是一种「如臂使指」的流畅感，让它成为一个专属的一体化输入利器。无需安装，一个U盘就能带走，随插随用，保密电脑也能用。

以下为支持的模型：

性能参考（20s 音频转录延迟）：

功能文档：

lspnicol · 2023 年5 月 28 日 09:42

大佬啊，capswriter真是好使，特地登录来捧场。不过这个离线版，安装要求对很多普通用户来说好像高了一点。

另外问一下大佬，capswriter还有没有更新计划呢？比如将来有没有可能自定义快捷键？

HaujetZhao · 2023 年5 月 28 日 10:20

比起注册阿里云的 API 已经很低了。下载 Python 、下载项目、下载模型、安装依赖，然后双击就可以用了。

你可以动手操作一下，看见哪里也会有问题不会做。而且在脚本里边也可以直接修改快捷键。

CapsWriter 的最终目标是完全离线化的实时语音输入，还在等合适 Windows 端开源的离线模型工具（实时识别）。

tingswin · 2023 年5 月 29 日 02:21

大佬，配置Python等等一系列操作对父母长辈来说实在太难。啥时候能出个exe的安装包

Aquamarine · 2023 年5 月 29 日 11:06

是不是也不支持Windows7？

Levon · 2023 年5 月 29 日 13:53

大佬，服务端01-sherpa-onnx-server.py跑不起来

看起来是里面的路径不太对但是py文件里没有设置路径的地方，是不是编译的时候，sherpa-onnx-offline-websocket-server里面写死了？

HaujetZhao · 2023 年5 月 29 日 14:05

你是没下载模型，只下载了脚本吧，模型要放到 paraformer-offline-zh 文件夹

rorschach-py · 2023 年5 月 29 日 15:35

不知道用Whisper.cpp改写一个有没有戏，之前试用过WhisperDesktop，编译后的exe文件体积还是很小的

HaujetZhao · 2023 年5 月 29 日 20:04

更新了，出 Win10-64打包版的了。

没戏，对算力要求太高，延迟太大

需要从源码运行。Python3.8 可以用。我没有精力去做 win7 的打包。

出打包版了，可以编辑 py 文件修改快捷键

aikebei · 2023 年5 月 30 日 03:20

我好像看到个实时的？

HaujetZhao · 2023 年5 月 30 日 14:17

实时的暂时没有 onnx 实现，速度很慢，也上不了 Linux 端。

aikebei · 2023 年5 月 31 日 06:03

好的，现在也很好用了，期待大佬的gui版本

275423729 · 2023 年5 月 31 日 11:28

好东西啊，先谢谢大佬。抽时间下载试试。

Geeling · 2023 年6 月 2 日 21:02

请问支持音频文件的转录吗？

alex27933 · 2023 年6 月 3 日 02:06

安装个虚拟声卡应该可以支持转录

HaujetZhao · 2023 年6 月 9 日 14:07

@Qingwa 邀请你来试用试用，我觉得这个质量能上首页

Qingwa · 2023 年6 月 9 日 14:55

来了来了

275423729 · 2023 年6 月 17 日 03:34

感谢大佬提供的这个软件。已经测试成功。开始一直启动不了客户端，窗口弹一下就消失了。经过调试，发现是加载音频流失败。最后把麦克风孔插上，再次运行就正常了。其实麦克风孔上插的是一个耳机，并没有麦克风，但同样能录入打字。这个帖子就是用语音输入实现的。

275423729 · 2023 年6 月 17 日 03:40

现在有一个问题就是，无法在每一段话后面加上句号，中间好像可以自动加逗号。两句话之间也没有加入空隙。用语音说句号，结果出来的是句号两个字。建议可以在每一段录音文字的后面加一个空格，这样便于后期人工加标点。或者说一段语音文字最后两个号是句号时，转换成标点。

HaujetZhao · 2023 年6 月 17 日 03:51

编辑客户端配置，配置方法看 Readme

话题		回复	浏览量
【Caps Writer 2.0】电脑语音输入工具（图形界面版）发布：按住大写锁定键说话，松开后文字上屏发现频道 appinned , windows	11	5076	2025 年2 月 25 日
Caps Wirter，电脑端最好用的语音输入工具：按住大写锁定键，进行语音识别输入发现频道 windows	16	8472	2023 年10 月 18 日
Handy - 听写助手！按下快捷键说话，松开输入文字。完全离线，本地运行青蛙的应用	33	1152	2026 年5 月 15 日
求一个电脑端的语音输入法问题求助输入法	34	5237	2021 年10 月 23 日
网络黄页——实时语音输入&语音输入法工具软件网络黄页语音输入法	1	72	2026 年5 月 13 日