想提取MP4中的硬字幕除了手抄之外还有其他方法嘛,比如字幕软件中带OCR这种。

如题,如果我想提取一个MP4中的硬字幕,除了手抄之外有没有什么机械化一点的方法,比如给个坐标自动OCR然后提取这种。

另外一个思路: 语音识别

openai whisper

巧了,最近也在思考这个问题。
我的需求是在线看外国剧的时候想要能自动识别字幕朗读出来。
这样就不用盯着字幕了,类似同声传译一般的感觉

硬字幕+OCR
还是能搜出来不少东西的, 甚至我网盘里有这类型软件, 但是没测试过, 就不贸然推荐了

这个如果针对中文还行,大不了自己之后手动对一下,但如果是外语,再转翻译,那就没法搞了和手抄也相差不大了。

换个思路,用openai直接转成中文配音,翻译水平已经不错了,比普通大学生六级强。

有专门字幕ocr的工具,但是ocr肯定做不到完美,需要人工校对。
另外就是,你ocr也只得到了文本,字幕效果/位置还得人工来写。(当然满足于用srt字幕就够的话,的确不用想这么多

这个好啊,先试试。

人工校对我感觉现在能直接扔给ChatGPT来弄,不行再说,做为极简党来说,字幕效果反而是多余的东西。

好的效果看起来还是很舒服的。例如视频里专门展示报纸时,有的字幕组就会让报纸显示成中文,而且还看起来很自然。
再极简也不会讨厌好看的,只不过是会觉得可以不做罢了

的确,但这种情况我也就不折腾了,我现在的需求一个是因为有些字幕组的字幕做的不好看或者难认,还有一些是因为老番现在有了蓝光,想给他搞下来做外挂这样。

video-subtitle-extractor
Video-subtitle-extractor (VSE) 是一款将视频中的硬字幕提取为外挂字幕文件(srt格式)的软件。 主要实现了以下功能:

  • 提取视频中的关键帧
  • 检测视频帧中文本的所在位置
  • 识别视频帧中文本的内容
  • 过滤非字幕区域的文本
  • 去除水印、台标文本、原视频硬字幕,可配合:video-subtitle-remover (VSR)
  • 去除重复字幕行,生成srt字幕文件
  • 支持视频字幕批量提取
  • 多语言:支持简体中文(中英双语)繁体中文英文日语韩语越南语阿拉伯语法语德语俄语西班牙语葡萄牙语意大利语87种语言的字幕提取
  • 多模式:
    • 快速:(推荐)使用轻量模型,快速提取字幕,可能丢少量字幕、存在少量错别字
    • 自动:(推荐)自动判断模型,CPU下使用轻量模型;GPU下使用精准模型,提取字幕速度较慢,可能丢少量字幕、几乎不存在错别字
    • 精准:(不推荐)使用精准模型,GPU下逐帧检测,不丢字幕,几乎不存在错别字,但速度非常慢

小爱翻译,你值得拥有

小爱翻译能朗读硬字幕吗?

我看看去

好像不大行,只能显示和翻译

之前有用过一个硬字幕的识别工具,基于OCR,可以本地离线运行,操作稍微繁琐一些,但是精准率还还不错,速度也快,叫做:硬字幕提取工具10.0,作者甚至整理出了2万字的使用文档…