Parler-TTS：一个完全开源的的高质量TTS模型Par-CSDN blink-领先的开发者技术社区

热门

最新

红包

立Flag

投票

同城

我的

发布

程序员的店小二

9 月前

truem0_46163918

Parler-TTS ：一个完全开源的的高质量TTS模型

Parler-TTS是一个由Hugging Face开发的轻量级文本转语音(TTS)模型，能够以给定说话者的风格（性别、音调、说话风格等)生成高质量、自然sounding的语音。它是基于Dan Lyth和Simon King发表的论文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作复现两位作者分别来自Stability Al和爱丁堡大学。

与其他TTS模型不同，Parler-TTS 完全开源发布，包括数据集、预处理、训练代码和权重。

高质量、自然sounding的语音输出:Parler-TTS能够生成高质量且听起来非常自然的语音。它可以根据给定说话者的风格(如性别、音调、说话风格等）进行定制，以产生与特定人声非常相似的输出。灵活的使用和部署:提供了易于使用的安装和部署方法，只需一行代码即可安装。此外，它还提供交互式演示和详细的训练指南，使用户能够快速上手并自定义模型。

- Datasets数据集Parler-TTS提供了开源的注释语音数据集，范围从1,000小时到即将到达的50,000小时。这为训练和改进TTS模型提供了丰富的资源。

GitHub: https:llgithub.com/huggingface/parler-tts
模型下载: https://huggingface.co/parler-tts
在线体验: https://huggingface.co/spaces/parler-tts/parler_tts_mini

AI资讯

CSDN App 扫码分享

分享

评论

点赞

打赏

复制链接
举报

下一条：