一个极简的本地人声背景音乐分离工具

一个极简的人声和背景音乐分离工具,完全本地化网页操作

将一首歌曲或者含有背景音乐的音视频文件,拖拽到本地网页中,即可将其中的人声和音乐声分离为单独的音频wav文件,可选单独分离“钢琴声”、“贝斯声”、“鼓声”等

自动调用本地浏览器打开本地网页,模型已内置,无需连接外网下载。

支持视频(mp4/mov/mkv/avi/mpeg)和音频(mp3/wav)格式

只需点两下鼠标,一选择音视频文件,二启动处理。

视频演示

1 Like

要是支持flac文件格式的上传就更好了。。

已支持 0.02或源码部署

感谢大佬跟进,目前使用中还是有bug,如:

  1. 之前已选5stems,后来改为使用2stems输出,结果分离生成6个文件(需要刷新网页才正常,估计缓存的问题)
  2. 分离英文歌曲的人声部分还是有电流声
    另外,后续可否加入批量分离音频的操作呀?!
  1. 之前的文件并不删除的,都在输出目录中

  2. 这个效果也就这样,目前是使用的 spletter模型,有点过气了,后续可能考虑 uvr吧

  3. 这个可以考虑增加