求一个电脑端的语音输入法

目前在使用讯飞的语音输入。好处是可以只使用它的悬浮窗,而键盘输入使用的是系统自带的输入法。我也写了个小脚本,可以一键启动悬浮窗,这非常方便,以至于我目前在电脑上大部分文字的输入都是通过语音来进行的,包括这些内容。

不过最近讯飞的响应不太稳定,有时候重复说几次都未必能够成功识别,这就会让人非常恼火,尤其是在某些需要即时交流的场景下。所以想寻找一个替代工具或者备用工具。

已知的,我在使用的工具中 uTools 的超级面板可以满足我的需求(但是好像长文本的输入比较麻烦),不过需要付费,虽然价钱也还可以,奈何囊中羞涩,所以问问有没有其他方案。


2021-10-16

实际使用了大概半个月,大部分时候响应迅速确实挺不错的。识别的准确率,尤其是一些细节文字的斟酌程度,和讯飞比几乎不相上下。

但后来还是放弃了他,转回了讯飞。

因为有的时候程序出错,导致没有获得识别结果。这可能不是程序的问题,而是接口的问题。但如果这时候重试,有可能(我自己单方面的猜测)触及到 API 线程的上限,所以只能等他自己把这个错误渡过去,API 认为其他请求的线程已经不存在,才能继续尝试。这在某些时候非常令人着急。

看了一下统计结果,每天我大概用 100 次左右的请求,所以如果真的按他的价格付费,每个月的成本大概在 10 元左右,这个价格比我的预算是要高了一些的。

以上供大家参考

Win+H 可以启用Windows自带语音输入,不清楚效果和讯飞对比怎么样。

说它不可用吧,偶尔还能认出几个字儿来,说它可以用吧,真的几乎不可用

搜狗输入法也有语音输入的功能.

我现在测试的是讯飞语音输入法的识别能力,目前来看识别能力非常棒,而且基本上不存在识别出问题的情况,这是个别字眼识别出错,但是呢,整句话输入之后也会更正。

现在我测试的是搜狗输入法的识别能力。目前来看,识别能力也非常棒。而且基本上不存在识别出问题的情况。个别字眼儿的识别能力甚至比讯飞还强。

搜狗老非常热心的,做一些分外的事情就不太喜欢

推荐CapsWriter语音输入工具,地址https://github.com/HaujetZhao/CapsWriter,开源

绿色版还行.image

需要自己申请 API,可是我有点懒,先备选吧

也用过绿色版的,但精简到不烦人的话,稳定性有点问题,稳定的话又可能有点烦人,一会儿我再试试

不讨论搜狗是否偷偷上传用户信息,它真的不烦人,多年来一直使用官网下载的搜狗拼音,几乎没有所谓弹窗、广告等东西,甚至忘记什么时候把它们关闭的了。

讯飞好像在加大宣传力度,最近有点火,估计很快就要开始收费了。

适当的收费也是可以接受的,只要保证使用质量。但目前收入需求不是特别高,虽然日常也全都用它吧,但是毕竟最近没有在高强度的写作。所以如果为了语音输入,一年花费100块钱,觉得有点贵了。如果一年36块钱,我倒是挺愿意考虑一下的

可以找个淘汰手机架在嘴边(我用的N年前的红米2)。

手机电脑都安上unified remote。

手机安装百度或搜狗或讯飞(我用的百度,因为有轻声识别功能,用耳语一样大小的声音都能识别的很好)。

然后就可以通过手机输入法给电脑打字了。

电脑端语音输入真的太拉,这也是个没有办法的办法了

讯飞也有耳语识别,而且对于一些句子中个别字词判断,我是觉得讯飞要比其他语言输入都强一些的。但讯飞的pc输入法n久不更新,手机输入法除了语音部分,其他的功能都差强人意,就很难受。我现在手机上的输入法用的百度,打字是真的不错,但是语音识别比讯飞,还是要靠差一些。比如我现在在公交车上输入这段文字,如果用讯飞,我有信心完全不用修改,你也能够看得懂,但是用百度就不行,甚至我还得特别的提高一下音量

建议先看看 capswriter 的视频演示效果

我终于把它配置好了,然后现在就是使用它在进行输入。识别的效果和速度还是挺令人满意的,但是也存在几个问题。

  • 按住识别并不算很友好,其实可以根据语音的停顿,然后分段上传识别,这样在长文本输入的情况下就可以使用了
  • 不知道具体会产生怎样的费用,阿里云我以前没用过,不知道具体的计费原则
  • 主界面无法隐藏,最小化也只是最小化到任务栏,而不是到托盘

不过有一说一识别的速度和稳定性确实要高了好多,使用流畅带来的体验提升还是非常明显的。

这个软件也可以试试,应该是个个人作品,看不出来是什么语音引擎的

按住识别灵感来自对讲机,也符合 api 的调用,同时不影响 caps 键的使用。识别语音停顿技术难度高,抗干扰能力差,大厂都做不到称心如意。

费用见阿里云文档。试用套餐免费,3个月。之后收费,1000 次 3.5 元。

感谢解答疑惑。我先试用一番。

收费后的价格其实有一些偏贵了,因为如果写作的话,一天或许就能用掉 1000 次。不过这还是我的猜测,先试用一段时间看看吧。(如果只是作为讯飞输入法不灵光时的补充,那就应该是很划算的了

1000 次听着少,其实你也不清楚自己语音输入到底一天能说多少次。

一个参考数据,我的一天使用量,多的时候也就 300 次左右。

如果在打游戏的时候,使用语音输入法是极其方便的,毕竟不需要切换输入法。但是一场游戏打下来输入几百次,应该是很正常的吧。