当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] HuggingFace 发布 Parler-TTS:高质量、可控的文本转语音 (TTS) 开源模型

WX20240411-182854@2x.png
Parler-TTS 是一种轻量级文本转语音 (TTS) 模型,可以按照给定说话者的风格(性别、音调、说话风格等)生成高质量、听起来自然的语音。它是Stability AI 和爱丁堡大学的 Dan Lyth 和 Simon King论文《具有合成注释的高保真文本到语音的自然语言指导》的复制品。

与其他 TTS 模型相反,Parler-TTS 是一个完全开源的版本。所有数据集、预处理、训练代码和权重均在许可下公开发布,使社区能够在我们的工作基础上开发自己强大的 TTS 模型。


声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海