Handy - 听写助手！按下快捷键说话，松开输入文字。完全离线，本地运行

Qingwa · 2026 年2 月 4 日 11:36

原始链接在： https://www.appinn.com/handy/

Handy 是一款简单易用的语音转文本工具，只需要按下快捷键说话，松开快捷键就自动完成了语音转文字。支持 Windows、macOS 和 Linux（新增 NixOS）操作系统。@Appinn

Handy 就是电脑上的听写助手，只需要：

按下快捷键 > 说话
松开快捷键 > 完成打字

非常简单、易用。

和语音输入法不一样，你说什么，它帮你输入什么。纯本地平时在后台运行。

主界面：

需要自行下载大模型（从应用内下载）支持 Whisper，如果电脑性能强悍，可以下载 Large，青小蛙尝试了 medium，用起来还不错。

主要是不需要配置，下载完模型之后，立即可用。

核心功能

MIT 授权，完全免费、开源
完全离线运行，大模型在本地运行
通过全局快捷键（可以自己设定）来控制录音：按下开始说话，松开就自动转成文字并粘贴。
支持 Windows、macOS 和 Linux、NixOS（新）、操作系统。

适合用户

不喜欢打字、想用语音输入的人，比如需要快速把讲话内容变成文字的人。
隐私敏感的用户，希望自己语音不会传到互联网或第三方服务器处理的人。
需要提高工作效率的创作者或办公用户（写邮件、写文档、写代码注释等）。
开发者或技术爱好者，想研究或二次开发语音识别工具的人，因为是开源的。

获取

GitHub

原文：https://www.appinn.com/handy/

2026年的第二个精选。

PumpkinSin · 2026 年2 月 4 日 13:05

和这个比起来如何

Caps Wirter，电脑端最好用的语音输入工具：按住大写锁定键，进行语音识别输入

发现频道

软件名称 Caps Writer 应用平台 Windows MacOS Linux 只有 Windows 有打包好的 exe 文件。利益于 python 的跨平台特性，其它平台只需要自行安装依赖，再运行 python 脚本使用。推荐类型【开发者自荐】一句简介一款语音输入工具，下载运行后，把它最小化，按下大写锁定键超过 0.3 秒后，开始语音识别，松开按键之后，自动输入识别文字。应用简介本工具（Caps Writer）是一个电脑端的语音输入工具，使用了阿里云的一句话识别 API （有兴趣的可以修改源代码改成百度、腾讯、讯飞的 API 试试）。使用方法很简单：运行程序后，按下 Caps Lock （也就是大写锁定键）超过 0.3 秒后，就会开始用阿里云的 API 进行语音识别，松开按键后，会将识别结果自动输入。（不用担心会启用大写锁定，在松开的时候，大写锁定状态会自动恢复）因为使用了阿里云的 API，所以需要用户自己到阿里云申请，再填到 token.ini 中才能正常使用。对于聊天时候进行快捷输入、写代码时快速加入中文注释非常的方便。开发…

Aquamarine · 2026 年2 月 4 日 18:38

目前语音输入法太多了，功能大致都相近。

Colin5887 · 2026 年2 月 4 日 20:59

CapsWriter我用了

新版的阿里的大模型，相比之前的模型，速度明显下降，之前的转译耗时大约是录音时长的1/20。新版的变成了大约1/5.十分影响手感。
而且新版的阿里模型，如果放上一晚上，第二天再使用，会莫名其妙的不输出标点符号。
CapsWriter的大模型需要使用百度网盘下载，像我这种没有中国手机号的，费了好大的力气，找到国内的一个朋友，用他的百度号下载的。极其不方便

至于效果

一般认为阿里的模型会更懂中文，Whisper的中文没有那么好…….但是Whisper不会不输出标点
Handy的Star远超过CapsWriter，我简单浏览了下代码，明显要更好，CapsWriter的代码很明显是Vibe Coding出来的东西，这些代码确实工作，但是……..
其他的还没啥感觉。

zjmwlp · 2026 年2 月 5 日 10:27

还有一个离线版的项目,但是每次加载模型(如果有加载标点模型的话)时间蛮长的,handy使用whisper对于这个离线版项目有优势吗

CapsWriter-Offline

HaujetZhao · 2026 年2 月 5 日 10:40

你还不知道吧，已经更新到 2.3 了，现在服务端加载不超过5秒钟。

用上了 Fun-ASR-Nano 模型，这是我实测中文识别率最好的模型，在 CPU 下的 RTF 0.1，在 GPU 加速下可低于 RTF 0.05，而且模型本身就支持热词功能。

Whisper 完全没有可比性。

akibaizumi · 2026 年2 月 5 日 13:17

Handy我说中文他输出英文，音译……
上面大神的CapsWriter-Offline好用，速度也快。就是Fun-ASR-Nano模型默认vulkan启用之后运行不了，关闭就可以，不知道啥原因……

Qingwa · 2026 年2 月 5 日 13:37

设置里选中文

Aquamarine · 2026 年2 月 5 日 16:56

我这边Parakeet V3模型只能输出英文，模型也没说只支持英语，其V2版本倒是说了。
Whisper Medium模型，自动识别出来的是繁体中文，设置语言后正常。但是会出现转文本卡顿，无法上屏（可能和我安装了Ditto有关），甚至程序卡死需要强制退出的情况。
总体来说不如LazyTyper的兼容性好，不过它的Github文档还不错。

akibaizumi · 2026 年2 月 6 日 01:31

我就是用的推荐的Parakeet V3模型你不说我都没在意难怪没找到识别语言的设置切换Whisper系列任何模型程序都自动退出还是用不了……我还是继续CapsWriter-Offline吧……有空试试LazyTyper，刚看了一下也有FunASR Nano GGUF模型

Qingwa · 2026 年2 月 6 日 02:03

还有闪电说可以试试

Aquamarine · 2026 年2 月 6 日 04:25

当初我是在闪电说和LazyTyper中挑选，闪电说用的本地模型，LazyTyper用的在线模型，后来LazyTyper加了本地模型后我就选择了它，因为它的功能可以覆盖闪电说。

zjmwlp · 2026 年2 月 6 日 09:17

大佬,最新版模型载入虽然快,但是我使用过程中发现,它这个转录时延有点太长了,旧版是1、200ms.请问我需要怎么优化..

Colin5887 · 2026 年2 月 6 日 09:23

升级电脑吧，这个模型就这样，我这里速度也慢，而且，没什么解决方案

所以我才用回旧的模型

zjmwlp · 2026 年2 月 6 日 09:28

我旧电脑才2G显存轻薄本.新电脑有8G显存,晚点用新电脑看下,应该速度会快点..

Colin5887 · 2026 年2 月 6 日 09:33

我主力机是4070，速度还行

7/24运行的服务器是5560U配3200的32G内存，速度很慢

最后，换回老版本的模型解决一切问题

HaujetZhao · 2026 年2 月 6 日 09:34

你这个慢，指的是最新发布的 v2.4 对比 v2.3 慢了很多？还是对比 v1 慢了很多？

HaujetZhao · 2026 年2 月 6 日 09:37

你把 server log 发我邮箱看看 [email protected]

cpu不至于这么慢

zjmwlp · 2026 年2 月 6 日 09:37

对比v1, 2G显存跑满了刚刚好,时延大概1秒多.

HaujetZhao · 2026 年2 月 6 日 09:38

你去 config 关掉 vulkan 看看用 cpu 跑的速度怎么样

话题		回复	浏览量
CapsWriter-Offline，可能是最好用的 PC 端语音输入工具（离线识别）发现频道 appinned	84	15250	2026 年5 月 13 日
Caps Wirter，电脑端最好用的语音输入工具：按住大写锁定键，进行语音识别输入发现频道 windows	16	8472	2023 年10 月 18 日
【Caps Writer 2.0】电脑语音输入工具（图形界面版）发布：按住大写锁定键说话，松开后文字上屏发现频道 appinned , windows	11	5076	2025 年2 月 25 日
网络黄页——实时语音输入&语音输入法工具软件网络黄页语音输入法	1	72	2026 年5 月 13 日
求一个电脑端的语音输入法问题求助输入法	34	5237	2021 年10 月 23 日

Handy - 听写助手！按下快捷键说话，松开输入文字。完全离线，本地运行

主界面：

核心功能

适合用户

获取

CapsWriter-Offline

相关话题