手机语音控制电脑

在这个地方https://meta.appinn.net/t/topic/39526发了篇帖子,讨论了 基于AHKHttp来实现手机控制电脑 目前面临的技术问题,即如何利用AHKhttp加载中文html页面。

对于如何利用语音控制电脑,个人也做了些分析,希望发个帖子一起探讨下。

可能技术路径

  1. 手机+局域网
  2. 智能音箱+局域网:暂不可行
  3. 手机+广域网/移动数据
  4. 智能音箱+广域网/移动数据
  5. 全向麦克风+局域网
  6. 语音鼠标+电脑连接广域网
  7. 手机+局域网http-server

当然还包括一些远程类的app,或者模拟键鼠之类的app,不在此讨论范围内,这个帖子主要想讨论如何利用语音控制电脑

个人分析结论

手机+局域网AHKhttp具有如下综合优势,所以作为优选技术路径:

  1. 聚合性非常好/自定义性:
    一个html页面中就可以实现常用操作:比如点击打开某个网站,开关机,可以在index.html 中设置一个超链接
  2. 容错性高:点击图标跟跟语音互补,容错性高;语音助手来自于手机语音输入法,哪家强大就用哪家的,搭配性,容错性都比较高
  3. 多端控制:手机,平板都可以。 控制电脑时不用去找小米小爱语音鼠标这个硬件;
  4. 多用户控制:家人要操作时,只要用浏览器打开AHKHTTP 加载的网页http://HTPC_ip:8000/就可以
  5. 安全性高: 局域网内操作,即使断网,只要HTPC和手机是处在同一局域网内都可以控制

## 讲这么多,关键是AHKHttp 加载中文的问题还没解决, so saaaad.
2023/01/14: 已经解决AHKHttp 中文乱码问题了,主要是其中的URI class 下的encode和decode 不支持中文。换一个编解码函数就行了。

  1. 语音控制电脑, windows其实自带.

  2. 你要做的就是远程语音. 比如一个可以远程播放声音的智能音箱.

如果你觉得系统自带的不好, 小爱同学也可以:

这个有意思,但是没有安装按钮。
是不是有设备型号的白名单?
是不是要改机型?

内网使用自己控制端口号就行,最多跟家人分享,不用白名单。这也是局域网网页控制的优势之一。最新链接:

看你也做了很多方案,你要不要考虑一下。前后端完全分离的方式,前端负责发送信息,后端负责处理数据并返回计算结果。比如,前台发送一个要打开cctv1的json数据给后端,后端执行并返回执行成功的json文件,前端再显示出来。
json标准化后就有很多好玩的方案出来了,网页、语音、按键都可以