老罗的【且听】是自己开发的文字转语音么

常用的看书APP(带朗读功能的)个人用下来效果依次是:

番茄多人自然>番茄成熟大叔=起点说书先生>微信读书2025男生B

这几个都算T1级别,如果不发生错误的情况不注意难分真人,但遗憾的是像断句错误或者是突然声音改变、语气不对的情况下,时常有发生。不过,对比传统的TTS,或者说2024年之前的效果来讲,现在真的已经挺好了。

然后今天下载了一下且听,试用了一下,发现简直断层T0,它里面一共有4个音色,一男一女。然后这一男一女还有一个ASMR版。我听了一个1小时40分钟的解说。没有任何断句错误,声音改变,语气不对的问题。

如果说细红线憋了好几年憋出来的这个产品有任何亮点的话,我觉得就是这个文字转语音的模型,简直太棒了。在读书这种应用场景,我常用的MiniMax 2.6HD和B站开源的IndexTTS2,在流畅度、准确度上都远远不如这个。

挂一个邀请链接

送你一个月且听会员,万本好书等你来听:https://invite.erduoshuku.cn/C58FD0DD/CHUN+LONG

版权是最大的问题

上点成人小说就好了,我经过调研后发现,小黄书之于小视频,相当于XXX之于XXXX。

------------已修改违禁药品名称.

为了规避版权问题,不提供书的原版内容,全部说是用AI写的解读稿。但这样版权问题也挺模糊的

360行,行行都涉黄

进去看了一下,都是“正经书”。没有轻小说之类的闲书。

这年头比较火的书经常会有人会去做配音。对于AI配音来说,反而冷门书才是更需要的,毕竟AI生成相比有制作的多人配音作品还是比不了。

有没有AI语音比较好,二次元小说又比较多的平台。小众的轻小说没有什么大手子会去做配音,但是纯读文字在这个时代又有点折磨。

涉黄的东西发展都巨快,更别提境内了

微信读书倒是有轻小说,不过都是比较出名的

所以有没有技术大佬帮着分析一下,这个tts技术

我觉得只是进行了逐字的发音校对吧,
它这个应该不是实时TTS那种小模型,
只是提前做好的音频,用了类似 index TTS2这种大的模型吧

主要是效果真的无敌好,Minmax 2.6HD、index TTS2、Qwen3 TTS flash,豆包语音合成2.0直出都没这么好

黄才是生产力核心