现在的语音识别技术为啥需要依赖网络?

很不理解的一件事就是,不管是智能音箱还是手机输入法的语音输入功能,为啥都需要依赖网络?

运算量大,数据模型大,个人设备不太容得下

依赖网络也是为了提高识别正确率

语音输入法都有本地包啊,不过不支持长文本,应该是运算量上去了。

1是通过这方式获取大数据.

比如好几亿人通过微信发语音消息, 所以微信的语音文字识别能力提升的特别快.
短短几年就赶上了在这个领域耕耘多年的讯飞.

2是云识别引擎是不断升级的.

可以提供更好的服务.

3是云端的算力和存储更大, 对于手机来说, 为了识别安装大尺寸模型得不偿失.

2 个赞

曾经用过讯飞的离线版,感觉识别效果也没明显差异。

:grinning:个人猜测,一定还有其他动机!哈哈

觉得也没必要特别阴谋论。首先,依赖网络确实有它的必要性,然后数据被如何利用多数都是经过用户同意的,只不过没几个人认真阅读协议罢了。

保护自身的知识产权. 放到本地就有被破解,反编译,包括分析语言模型算法等等的可能性.

还有一个动机是计费 语音识别都是按次按长度计费 偶尔用一次的东西让人斥巨资购买不合适 用的频繁的被一次买断不赚钱