有没有把混合起来的几个人声导出为每个人的单独人声的软件?

好像只见过分离人声和音乐的

这种叫做 speaker diarization(说话人分离)

可以试一下这个库。

1 个赞