Qingwa
(青小蛙)
1
原始链接在: https://www.appinn.com/handy/
Handy 是一款简单易用的语音转文本工具,只需要按下快捷键说话,松开快捷键就自动完成了语音转文字。支持 Windows、macOS 和 Linux(新增 NixOS)操作系统。@Appinn
Handy 就是电脑上的听写助手,只需要:
- 按下快捷键 > 说话
- 松开快捷键 > 完成打字
非常简单、易用。
和语音输入法不一样,你说什么,它帮你输入什么。纯本地平时在后台运行。
主界面:
需要自行下载大模型(从应用内下载) 支持 Whisper,如果电脑性能强悍,可以下载 Large,青小蛙尝试了 medium,用起来还不错。
主要是不需要配置,下载完模型之后,立即可用。
核心功能
- MIT 授权,完全免费、开源
- 完全离线运行,大模型在本地运行
- 通过全局快捷键(可以自己设定)来控制录音:按下开始说话,松开就自动转成文字并粘贴。
- 支持 Windows、macOS 和 Linux、NixOS(新)、操作系统。
适合用户
- 不喜欢打字、想用语音输入的人,比如需要快速把讲话内容变成文字的人。
- 隐私敏感的用户,希望自己语音不会传到互联网或第三方服务器处理的人。
- 需要提高工作效率的创作者或办公用户(写邮件、写文档、写代码注释等)。
- 开发者或技术爱好者,想研究或二次开发语音识别工具的人,因为是开源的。
获取
原文:https://www.appinn.com/handy/
2026年的第二个精选。
2 个赞
zjmwlp
(czl)
5
还有一个离线版的项目,但是每次加载模型(如果有加载标点模型的话)时间蛮长的,handy使用whisper对于这个离线版项目有优势吗
你还不知道吧,已经更新到 2.3 了,现在服务端加载不超过5秒钟。
用上了 Fun-ASR-Nano 模型,这是我实测中文识别率最好的模型,在 CPU 下的 RTF 0.1,在 GPU 加速下可低于 RTF 0.05,而且模型本身就支持热词功能。
Whisper 完全没有可比性。
Handy我说中文他输出英文,音译……
上面大神的CapsWriter-Offline好用,速度也快。就是Fun-ASR-Nano模型默认vulkan启用之后运行不了,关闭就可以,不知道啥原因……
我这边Parakeet V3模型只能输出英文,模型也没说只支持英语,其V2版本倒是说了。
Whisper Medium模型,自动识别出来的是繁体中文,设置语言后正常。但是会出现转文本卡顿,无法上屏(可能和我安装了Ditto有关),甚至程序卡死需要强制退出的情况。
总体来说不如LazyTyper的兼容性好,不过它的Github文档还不错。
我就是用的推荐的Parakeet V3模型 你不说我都没在意 难怪没找到识别语言的设置 切换Whisper系列任何模型程序都自动退出 还是用不了……我还是继续CapsWriter-Offline吧……有空试试LazyTyper,刚看了一下也有FunASR Nano GGUF模型
当初我是在闪电说和LazyTyper中挑选,闪电说用的本地模型,LazyTyper用的在线模型,后来LazyTyper加了本地模型后我就选择了它,因为它的功能可以覆盖闪电说。
zjmwlp
(czl)
13
大佬,最新版模型载入虽然快,但是我使用过程中发现,它这个转录时延有点太长了,旧版是1、200ms.请问我需要怎么优化..
升级电脑吧,这个模型就这样,我这里速度也慢,而且,没什么解决方案
所以我才用回旧的模型
zjmwlp
(czl)
15
我旧电脑才2G显存轻薄本.新电脑有8G显存,晚点用新电脑看下,应该速度会快点..
我主力机是4070,速度还行
7/24运行的服务器是5560U配3200的32G内存,速度很慢
最后,换回老版本的模型解决一切问题
你这个慢,指的是最新发布的 v2.4 对比 v2.3 慢了很多?还是对比 v1 慢了很多?
你把 server log 发我邮箱看看 [email protected]
cpu不至于这么慢
zjmwlp
(czl)
19
对比v1, 2G显存跑满了刚刚好,时延大概1秒多.
你去 config 关掉 vulkan 看看用 cpu 跑的速度怎么样