【Caps Writer 2.0】电脑语音输入工具(图形界面版)发布:按住大写锁定键说话,松开后文字上屏

软件名称

Caps Writer 2.0

应用平台

  • Windows
  • MacOS
  • Linux

其中,我只有 Windows 电脑,只能打包 Win64 版本,Linux 和 MacOS 运行需要直接跑 python 源码。

推荐类型

【开发者自荐】

一句简介

顾名思义,Caps Writer 就是按下大写锁定键来打字的工具。它的具体作用是:当你长按键盘上的大写锁定键后,软件会开始语音识别,当你松开大写锁定键时,识别的结果就可以立马上屏。

应用简介

  • 软件内置了对阿里云一句话识别 API 的支持。
  • 大写锁定键用作语音输入,更方便
  • 速度比讯飞语音输入法电脑版和搜狗输入法要快

    讯飞和搜狗输入法在说完话,松开快捷键之后,需要等待1到3秒钟才能完成识别上屏,这让我体验非常不爽。但 Caps Writer 在松开大写锁定键之后,就会立马上屏,速度非常快。

目前软件内置了对阿里云一句话识别 API 的支持。如果你要使用,就需要先在阿里云上实名认证,申请语音识别 API,在设置页面添加一个语音识别引擎。

添加其它服务商的引擎也是可以做的,只是目前阿里云的引擎就够用,还没有足够的动力添加其它引擎。

具体使用效果、申请阿里云 API 的方法,可以参考我这个视频: CapsWriter 2.0 使用视频

添加上引擎后,在主页面选择一个引擎,点击启用按钮,就可以进行语音识别了!

启用后,在实际使用中,只要按下 CapsLock 键,软件就会立刻开始录音:

  • 如果只是单击 CapsLock 后松开,录音数据会立刻被删除;
  • 如果按下 CapsLock 键时长超过 0.3 秒,就会开始连网进行语音识别,松开 CapsLock 键时,语音识别结果会被立刻输入。

所以你只需要按下 CapsLock 键,无需等待,就可以开始说话,因为当你按下按下 CapsLock 键的时候,程序就开始录音了,只要你按的时长超过 0.3 秒,就肯定能识别上。说完后,松开,识别结果立马上屏。

在设置界面,将 点击关闭按钮时隐藏到托盘 选项勾选,就可以将软件隐藏到托盘栏运行:

官方网站 && 应用商店地址

仓库地址:https://gitee.com/haujet/CapsWriter

发行版下载地址:CapsWriter 发行版 - Gitee.com

请问下阿里云的一句话识别,开通试用后有个试用期,结束之后还能免费使用么?

那就得商用版,3.5元/1000次。我觉得不算贵。后面有时间我加上腾讯的引擎,每月有 3000 次免费额度,只是速度可能会比阿里慢些。

所以现在阿里云就是免费3个月,腾讯云提供带额度的永久免费,是这个意思吧 :joy:

这充分说明好的服务还是要付费啊

是的。现在国内语音识别综合质量和价格,阿里云是最好的。讯飞只能一次几千块买一年的定量额度包,个人根本用不了。

这个必须支持,电脑必备软件。

可是我明明可以免费用讯飞提供的。
使用上唯一的区别就是,讯飞用的时候有一个不能关掉的窗口罢了。以及使用的是F10按键

就语音输入的速度而言,如果讯飞输入法的速度是儿童步行,那我这个输入速度就是博尔特百米冲刺。

最近在写东西,有大量的文字输入需求,个人打字速度又一般,就对比了一下讯飞和capswriter。
就快捷键的使用上而言,我用AHK将F6映射到鼠标的功能键上,可以比较方便地按下讯飞的启动键。虽然按住Capslock启动也还可以,但我用AHK将CapsLock绑定到鼠标上就总是出问题,从这个角度上说,讯飞还要方便一些。希望作者以后可以加入自定义快捷键的功能。
但讯飞的录音启动时延确实是个问题,经常会有一开始说的一两个字没有被录上的情况。在使用的时候通常需要等待一下再开始说。用capswriter就完全没有这个问题,这一点给个大大的赞!
在识别精度上,阿里和讯飞两个平台似乎差不多,我的主要抱怨在于两个平台都喜欢在长句识别的时候给我乱加标点。

2 个赞

我在使用这个过程中微信无法上屏,识别是识别到了但是都手动粘贴在微信输入框里。
由于讨论群加不进去,想来问问有没有解决办法。