lenno
(Lenno/柠檬猫)
1
有一些录的教学视频没有字幕,想要自己配上字幕。
谷了一圈、论坛也搜了下,到目前为止的尝试如下,抛砖引玉,希望众友提供比较好的方案。
可以是一个工具,也可以是先生成字幕/文本,再由第二个工具进行文本和时间轴修正。
要求就是,快速简单。
1.剪映/Capcut
剪映CN的字幕功能是收费的,Capcut国际每月5次限免。
除去这两个限制,字幕生成和修改是体验最好的,速度也快。
2.CapsWriter (Github链接)
大模型速度快,效果尚可,准确率不错,但是断句不太好,也可能是这是录的现场视频有很多语气助词和停顿。
不过字幕修改是通过修改txt再改回去srt的,时间轴的对应我不太会弄。
3.青梧字幕
论坛搜到的,免费版停留旧版,small模型错误很多,large模型慢的要死……
把CapsWriter生成的srt字幕导入进去还不能完全识别,只有第一句。
不过这种左边视频、右边时间轴字幕的修正方式挺好的。
希望有类似的。
4.必剪
哔哩哔哩出的工具,对标剪映。
只针对字幕生成和修改的评测:字幕准确性和速度都不错,但是只能改错字进行微调,不能改时间轴。
比如有一段话长了要截成两段字幕就没办法。
1 Like
Emm… 冒昧地提一个建议:“转录” 是生物学上的一个术语(具体含义学过高中生物必修二的应该都清楚,这里就不展开讲了),指的就是根据 DNA 模板生成 RNA,没有其他含义。因此最好还是不要在其他领域使用,否则 … 感觉有点怪。
BackT0
(_)
4
CapsWriter你用的是带标点符号模型的吗
我觉得带标点的断句还是可以的, (Whisper断句好但是相比慢太多了) 但是这个模型对多音字稍弱 不过人工筛一遍基本都能挑出来
lenno
(Lenno/柠檬猫)
5
是的,带标点符号的模型。
可能是我的视频问题,录制的现场讲话语气词太多、停顿也比较多。
CapsWriter生成的字幕文本还可以,主要是我需要一个左边视频右边时间轴字幕的工具来修正,但是我不知道哪个工具适合。
转录这个词,搜百度确实是生物学的那个术语。
但是
- 在网络社区(简中、繁中社区均有)中也有很多使用这个词作为「把口头话语写为书面文字」的意思。大概为转换、记录。
- 搜音频转录、视频转录则能出现很多和本帖子主题相似的话题。
- 生物学中的转录的英文大概是 transcription,本身就有誊写的含义。
不能说一个词在某个领域被使用了,在其他领域就不能用了。科学界给概念起名字很多情况下就是使用最形象的词语。
我认为词语的使用应该是不断发展的。当初生物学领域也是给「根据 DNA 模板生成 RNA」使用的 Transcription。
我认为考察概念不能只看百科或 Wiki。
此文档中多次使用「转录」
更新,这两天研究音乐,发现同术语 transcription、扒谱(最常用)、转谱、采谱。
大意是通过反复听原曲,把谱子复写出来。是乐手的基本技能。
3 Likes
BackT0
(_)
7
我知道一个右边视频 左边时轴的不知道是否能满足你 狗头.jpg
开源免费 好像很久以前停更过, 缺点是半点AI功能都不沾 也支持Whisper转录(根据官网)
https://www.nikse.dk/subtitleedit
sdfds
9
2 Likes
错了,subtitleedit里面有各种whisper的转录功能,还有AI翻译功能
yazii
(Yazii!)
11
剪映语音转字幕改为收费后,免费功能就很鸡肋了,月费还挺高,emm
必剪是不能导出字幕文件的
在线平台终究没那么靠谱,还是本地电脑跑whisper.cpp吧
BackT0
(_)
12
还真是, 我这边用的一直是21年下的版本 使用频率不高也就没更新了
Sullevy
13
whisper.cpp 好像有时间轴对不齐的情况,不知道有没有解决的方案。
编辑视频字幕我用 arctime
ririliu
14
Adobe Premiere Pro + Adobe Speech to Text插件也能实现语音转字幕,好像也是利用本地大模型跑的;
不过整套都是adobe的,不方便自己更换大语言模型,还缺少字幕翻译的流程
jameon512
(okaymyworld)
15
不如看看这个,本地模型和在线api、支持语音转录、合成、翻译等
3_5105
16
根据您的提问可以立即提出一个解决方案:您可以搜索“已除去限制”的剪映版本