可以在看在线视频、本地视频,或用麦克风说话时,把听到的语音实时的转为文本
LiveCaption : LiveCaption 是一款支持使用第三方公共云接口,实时将系统或麦克风的声音识别显示为桌面字幕的Windows软件,支持其他语种的同步翻译。 (gitee.com)
另外因为现在的语音模型都是面向一般数据集训练的,准确度不能期望太多,尤其是遇到专有名词/术语的时候,看 B 站的人工智障字幕就知道了。
如果是英文的话,Chrome 是支持自动识别网页语音并显示字幕的,见 在 Chrome 中使用实时字幕 - Google Chrome帮助。
1 个赞
Win 10上是按下Windows+H
进入语音听写,老实说比较挑麦克风,我用笔记本自带凑近了还好,稍远一点就不行了
感谢分享,我试试看
这个方法可以识别播放视频的语音吗?
彩云可以
如果那个文件能用 Chrome 播放,直接用 Chrome 的实时字幕功能。
@ muzuiget Chrome 的「无障碍」 → 「字幕」貌似只支持英文?
顶一下,这个场景的应用需求,应该很多
搜狗输入法,开启长语音模式,测试过可以一个小时一直转文字。注意先测试一下电脑的录音功能,录一小段,然后自己播放看看能不能听清。