各位好,我的系统是Windows 10,暂不考虑升级,想找个识别电脑正在播放的声音,然后转文字,开箱即用的软件。(也可以称作是实时字幕?)
听播客有时候不专心可以看字幕偷懒(
具体要求
0、免费无限制,或者较低价格可以买断
1、要求识别正确率高 不限制所用的模型(我听的播客会有中英夹杂的情况)
2、有图形界面 能显示字幕、配置文字大小就可以
3、有标点恢复
4、最好能区分说话人
5、不要对接在线API的,除非接口是免费不限量的并且效果能赶上Whisper。
目前在用TMSpeech,但是识别效果有点差,里面两个模型都试了,所以想看看有没有更好的
尝试了WhisperLiveKit,识别效果可以,但是只可以识别麦克风。用了官方给的chrome扩展,还是只能识别标签页的声音。并且使用的时候要点击扩展图标,弹出的窗口如果点到其他地方就没了,很不方便。 我知道用虚拟audio cable可以将电脑声音作为麦克风输入,但是这样我觉得……怎么说呢,不够优雅?
chrome自带的识别正确率更低
win10系统没有自带实时字幕功能
注意不是录音/音频文件转字幕
搜了几天没找到合适的 可能我搜索能力下降了
先看看大家有没有推荐的成品 国产软件也可以
没有的话只能找ai写一个了