Bark - 高度逼真的开源、生成式文字转语音模型

Qingwa · 2023 年5 月 12 日 08:54

原始链接在： Bark - 高度逼真的开源、生成式文字转语音模型 - 小众软件

Bark 是一款高度逼真的开源、生成式文字转语音模型。它可以生成类似真人的多语言语音，还能生成音乐、背景噪音等简单的音效，以及可以根据文字内容产生笑、叹息和哭泣、喘息声、清嗓子等声音。英语效果优秀，中文效果一般。@Appinn

感谢 @orange.ai 的推荐：

非常真实自然的语音
英文效果最佳，其他语言还欠佳
支持通过文本生成歌曲
支持生成背景噪音、简单的音效
支持大笑、叹息、哭泣
开源模型，自己可以下载玩，也可以去官方排队体验

Bark 使用 MIT 许可证，允许商用。经过 CPU 和 GPU 测试（pytorch 2.0+, CUDA 11.7 和 CUDA 12.0)。

例子

Bark 是完全生成式的文本-音频模型，它不是传统的 TTS 模型，会根据文字描述生成很多意想不到的内容。

获取

https://github.com/suno-ai/bark

原文：https://www.appinn.com/suno-ai-bark/

yuze0804007 · 2023 年5 月 13 日 08:36

执行缓慢:No GPU being used. Careful, inference might be very slow!
解决方案: 检查torch版本, 如果结果是cpu, 重新安装CUDA版torch
检查torch版本:

import torch

print("Torch version:", torch.__version__)
print("CUDA available:", torch.cuda.is_available())
print("Number of GPUs:", torch.cuda.device_count())
print("GPU name:", torch.cuda.get_device_name(0))

重新安装torch:

pip install torch==2.0.0+cu117 -f https://download.pytorch.org/whl/cu117/torch_stable.html

TonyJian · 2023 年5 月 15 日 03:10

听了个寂寞

Qingwa · 2023 年5 月 15 日 03:14

啊声音没录进去…

dishuostec · 2023 年5 月 17 日 05:18

尝试了各种参数的组合，生成的中文语音听着像方言

话题		回复	浏览量
Bark-Gui 生成式文字转语音模型 for 图形界面发现频道 🔎	0	709	2023 年5 月 18 日
BarkHelper，自己写的Bark PC端辅助软件发现频道 🔎 appinned	1	3644	2019 年3 月 1 日
语音转录工具，类似青小蛙之前推的buzz，但是使用GPU速度更快发现频道 🔎 appinned , windows , openai	16	8684	2023 年12 月 20 日
分享个自用的小工具~ 给你的 iPhone 发自定义推送发现频道 🔎 appinned	2	5482	2019 年2 月 26 日
简易的 Whisper 客户端，使用 OpenAI API 进行语音转文字青蛙的应用	5	1958	2023 年12 月 20 日

Bark - 高度逼真的开源、生成式文字转语音模型

例子

获取

相关话题