CapsWriter-Offline，可能是最好用的 PC 端语音输入工具（离线识别）

DANO · 2024 年11 月 2 日 07:31

我看到有个ahk 脚本，似乎可以把这个软件生成的 Windows terminal窗口给隐藏掉

我现在用这个软件来当会议，笔记记录使用，隔几分钟重新按一次
可能是因为笔记本性能的原因，似乎偶尔情况下它的按键会失效，需要多按一次

kmoui · 2024 年11 月 3 日 05:22

有人在里面发了自己更新的模型，在hanging face 上下载替换一下就行，我已经更新了

dangerboy · 2025 年1 月 15 日 14:04

阿里云的是不是失效了啊。

kasusa · 2025 年1 月 20 日 07:48

emm 你可以让蓝牙耳机仅作为放声音。

kasusa · 2025 年1 月 20 日 07:49

咋操作的有没有教程教教我 ~

kmoui · 2025 年1 月 20 日 16:35

在这个issue里

kasusa · 2025 年1 月 21 日 07:15

我试验了一下，最后还是识别不了，换回来了。这个issue里面写的有点乱。

kmoui · 2025 年1 月 21 日 07:28

我就是直接用的其他人上传的模型，然后下载替换之后可以正常使用。
确实是挺乱的，当时看了挺长时间的

DANO · 2025 年1 月 21 日 13:38

这里请教一个问题，如果我想用它来做语音的命令输入，我会需要把“空格”转换为真正的“ “，回车转变为{Enter}而非\r。
目前的模型rule规则似乎做不到这点，是否有什么合适的转移字符可以做到？

baifengs · 2025 年1 月 23 日 08:57

我也在用，应该出个gui版。不知道模式还有更新升级计划没有。总感觉还是个90分的产品，没有做到100分。

DANO · 2025 年1 月 23 日 09:17

有gui版，我记得在issue里面有人分叉了。

baifengs · 2025 年1 月 24 日 15:09

去看到那个gui分支了，但是不会用，好像是lu系统的不是win系统的吧。主要是不会用分支的文件。也没有整合包下载。

kmoui · 2025 年1 月 24 日 16:08

我一直在用，已经离不开了，关键是也没有什么其他代替产品。那个使用 api 的版本只能使用阿里的 api 也不更新。豆包升级的功能里面也加入语音云识别，但是没有这个好用。

hehe123 · 2025 年2 月 9 日 05:38

谢谢大佬，反馈一个问题：文件转录无法应用热词替换呃。我看issue175也反映了这个问题，但仍然没有解决……

275423729 · 2025 年2 月 25 日 09:48

以前使用正常，最近使用识别不了。不知是电流声音还是什么
得到的结果类似这样：

───────────现在可以开始识别了─────────────────────────────────────────

识别结果：好的好的好的好的
录音时长： 2.40s
识别时长： 0.23s
Real Time Factor: 0.09

识别结果：被告的的的的是是是是的的的的的这是没有没的
录音时长： 5.55s
识别时长： 0.44s
Real Time Factor: 0.08

因为无法上传图片，直接复制文字上来了。

是要升级还是要重新安装呢

很喜欢这个离线版的

dog · 2025 年2 月 25 日 10:09

对啊不知道怎么设置声音响度的阈值

人听着是空白的语音经常识别出来奇奇怪怪的东西

DANO · 2025 年2 月 25 日 15:12

soundswitch + EarTrumpet，
保证麦克风链接正常即可。
我也有这种情况，多半是选择的录音设备不对。

G.B · 2025 年5 月 12 日 02:34

对的。可以查看一下输出音源是否被其它程序或软件替换了，我之前也经常出现同样的问题，重启也无效。后来发现是因为使用的 NVIDIA Broadcast，导致把我的原生麦克风输出给替换了，关闭后就再也没有遇到这样的问题。

kasusa · 2025 年6 月 9 日 09:20

应该是麦克风有问题了。录个音试试呢。

sunnybreath · 2025 年10 月 20 日 14:08

csukuangfj更新了新的sherpa-onnx-paraformer-zh了

同时也提供了int8版本，

但是我下载了int8版本后替换模型，结果无法识别任何文字，输出结果是一片空白，既不是语音输入设备出问题（录音正常，有录音文件生成），也不是识别成「对，嗯，没有，我们」之类的噪音结果。

不知道是不是不能直接替换模型，还是需要别的什么操作之类的才能更新新的模型？

话题		回复	浏览量
Caps Wirter，电脑端最好用的语音输入工具：按住大写锁定键，进行语音识别输入发现频道 windows	16	8300	2023 年10 月 18 日
【Caps Writer 2.0】电脑语音输入工具（图形界面版）发布：按住大写锁定键说话，松开后文字上屏发现频道 appinned , windows	11	4994	2025 年2 月 25 日
Handy - 听写助手！按下快捷键说话，松开输入文字。完全离线，本地运行青蛙的应用	31	774	2026 年3 月 7 日
求一个电脑端的语音输入法问题求助输入法	34	5000	2021 年10 月 23 日
「ahk不联网咏唱术」——通过声音操纵电脑~ 讨论分享 windows	5	636	2024 年3 月 3 日

CapsWriter-Offline，可能是最好用的 PC 端语音输入工具（离线识别）

相关话题