HuggingFace 发布 Parler-TTS：高质量、可控的文本转语音 (TTS) 开源模型

小哪吒

Parler-TTS 是一种轻量级文本转语音 (TTS) 模型，可以按照给定说话者的风格（性别、音调、说话风格等）生成高质量、听起来自然的语音。它是Stability AI 和爱丁堡大学的 Dan Lyth 和 Simon King论文《具有合成注释的高保真文本到语音的自然语言指导》的复制品。

与其他 TTS 模型相反，Parler-TTS 是一个完全开源的版本。所有数据集、预处理、训练代码和权重均在许可下公开发布，使社区能够在我们的工作基础上开发自己强大的 TTS 模型。

[行业动态] HuggingFace 发布 Parler-TTS：高质量、可控的文本转语音 (TTS) 开源模型