只要 12GB 内存,Edge 就能实时翻译视频中的音频了。对,就是你想的那样。

原始链接在: 只要 12GB 内存,Edge 就能实时翻译视频中的音频了。对,就是你想的那样。 - 小众软件

Windows 11 上的 Microsoft Edge 141.0.3537.13(测试版)加入了一个基于本地 AI 的语音翻译功能,只需要 4 核心 CPU 以及 12GB 内存,即可将播放中的视频的音频,翻译成你喜欢的语言。对,就是你想的那样。@Appinn


来自 windowslatest 的测试称,目前仅支持少数输入语言(西班牙语、韩语、英语),语言选择非常有限,不能翻译成任意“你喜欢的语言”。

是不是有点失望?

实际上微软发布过一个名为 Real-time video translation(实时视频翻译)的页面,上面详细描述了具体支持的语言:

  • 西班牙语和韩语的音频来源可以翻译成英语
  • 英语音频可以翻译成西班牙语,印地语和俄语。
  • 计划将来支持其他语言。

以及少量支持的站点:

  • YouTube
  • LinkedIn
  • Reuters
  • CNBC News
  • Bloomberg
  • Money Control
  • Coursera

需要在设置中开启标题为“在支持的网站上提供视频翻译“(Offer to translate videos on supported sites)的功能。

用户开启功能后,需要下载 AI 模型,音轨基本无明显延迟。不过,一些情况下,AI 会误把同一个人的不同说话语气,识别为不同性别的声音进行配音,导致同一段对话中出现男女声音频繁切换,影响听觉体验。

虽然现在就能用了,但还是再等等吧,未来是美好的。


原文:https://www.appinn.com/edge-real-time-video-translation/

1 个赞

语音翻译?不是字幕的那种?

对,最终结果是让日文小电影直接说中文

1 个赞

天龙八部英文版 :grinning_face:

比想象中要高,之前whisper模型的内存占用好像都没这么高的样子

那一定不要东北话版的

这种东西想想也没啥,但有必要放到标题上嘛?
搞颜色也要分场合分对象吧
(无恶意,源自职业习惯的友善提醒)

哪里搞颜色了?你没有看一些找不到字幕的非英语电影的需求吗?

1 个赞

哪里搞颜色了?你的想法太多了吧

不知道哪里看回复吗?
我回复的是UP主的这句【对,最终结果是让日文小电影直接说中文】

你自己说的标题嘛。。

2 个赞