缘起
一直一来就想要通过语音来操纵电脑。
现有的方案有这5个:盘点支持用语音控制PC的软件
但是普遍中文识别不佳,操纵可玩性不高。
因此,我就想,如果能够把“语音”和“autohotkey”连结起来就好了。
这样一来,通过声音就能对电脑进行为所欲为的操作。
再加上一些关键词分类处理,更是可以实现一丢丢小智能。
终于,我看到了这个软件 LiveCaption https://gitee.com/641453620/livecaption 我发现,给这个软件用一小段ahk代码作个桥接,就可以完美实现我想要的功能啦。
适合用户
会autohotkey 基础。【ahk 1.0】
效果展示
示例通过语音打开小众软件和知乎
(字幕栏也可以最小化到任务栏,鼠标附近也会有提示)
示例通过语音打开文件(“打开XX”指令联动listary)
其他玩法举例
通过“浏览XX”指令联动浏览器打开特定网站。
通过“运行XX”指令联动listary运行特定软件。
通过“请打开XX”指令,联动listary查找但不打开XX文件【显示候选】
通过第一/第二。。。指令打开listary搜索的第N个候选项。
在文字编辑/绘图软件中,通过声音切换笔刷、字体等。
在游戏中,通过语言来攻击对手。
录制网课/教程的时候装大逼用~
快速插入常用字符串/时间日期等。
等等等等。
配置方法
- 首先在此处下载livecaption ,并按照说明进行配置(其中有哔哩哔哩链接):
LiveCaption : LiveCaption 是一款支持使用第三方公共云接口,实时将系统或麦克风的声音识别显示为桌面字幕的Windows软件,支持其他语种的同步翻译。 - 如图进行设置,标画出的地方需要特别注意
- 下载“ahk咏唱术”,修改代码中第十六行的路径为livecaption\文档记录 所在目录。
地址:http://dogbean.ysepan.com/
WatchFolder("C:\miniapp\livecaption-windows-1.0.8-x64\文档记录", "myFunc", SubTree :=1, Watch := 1)
- 按照格式增加自己需要的功能,预设有四种情况
;以下是主要代码区域,修改下面部分的代码实现自定义功能
;这部分通过识别开头两个字,实现分情况“智能”操纵
Switch headword
{
Case "打开":
sendinput,^#{Numpad0}
sleep,300
send,%mainword%
sleep,300
send,^1
return
Case "访问", "浏览":
return
Default:
}
;这部分通过识别开头两个字(拼音),实现分情况“智能”操纵
Switch headword
{
Case "dakai":
sendinput,^#{Numpad0}
sleep,300
send,%py_mainword%
sleep,300
send,^1
return
Case "fangwen", "liulan":
return
Default:
}
;这部分通过识别整个句子,进行特定操纵
Switch realtimewords
{
Case "知乎":
run www.zhihu.com
return
Case "小众", "小众论坛","小众软件":
run https://meta.appinn.net
return
Default:
}
;这部分通过识别整个句子(拼音),进行特定操纵
Switch py_realtimewords
{
Case "zhihu":
run www.zhihu.com
return
Case "xiaozhong", "xiaozhongluntan","xiaozhongruanjian":
run https://meta.appinn.net
return
Default:
}