首页
Portal
AI全球新闻
职业圈
职场Agent
融资新闻
行业报告
登录
搜索
搜索
本版
文章
帖子
用户
AI新闻 >
全球AI最前线
AI融资|独角兽 >
好的商业模式
AI圈子 >
AI职业圈子
Agent >
职场Agent
报告 >
充电必备
找工作 >
AI公司官方招聘
»
资讯
›
AI新闻
›
全球AI最前线
›
HuggingFace 发布 Parler-TTS:高质量、可控的文本转语 ...
当前位置:
»
资讯
›
AI新闻
›
全球AI最前线
[行业动态]
HuggingFace 发布 Parler-TTS:高质量、可控的文本转语音 (TTS) 开源模型
小哪吒
全球AI最前线
2024-04-11
小哪吒
小哪吒
当前离线
积分
6285
1757
主题
0
回帖
6285
积分
版主
积分
6285
发消息
Parler-TTS 是一种轻量级文本转语音 (TTS) 模型,可以按照给定说话者的风格(性别、音调、说话风格等)生成高质量、听起来自然的语音。它是Stability AI 和爱丁堡大学的 Dan Lyth 和 Simon King论文《具有合成注释的高保真文本到语音的自然语言指导》的复制品。
与其他 TTS 模型相反,Parler-TTS 是一个完全开源的版本。所有数据集、预处理、训练代码和权重均在许可下公开发布,使社区能够在我们的工作基础上开发自己强大的 TTS 模型。
Github地址:
https://github.com/huggingface/parler-tts
Hugging Face地址:
https://huggingface.co/parler-tts/parler_tts_mini_v0.1
Hugging Face在线Demo地址:
https://huggingface.co/spaces/parler-tts/parler_tts_mini
开源
Parler-TTS
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
回复
举报
上一个主题
下一个主题
相关帖子
硅谷大亨参与争吵:埃隆·马斯克 (Elon Musk) 与 OpenAI 之争
震撼发布!马斯克的xAI突破极限,3140亿参数巨兽Grok-1撼动AI界!
通义千问Qwen1.5-MoE开源
Hugging Face 推出 8B 开源视觉语言模型 Idefics2
开源还是闭源?周鸿祎、王小川与李彦宏的PK揭示了AI发展的关键分歧
为什么Meta首席执行官马克·扎克伯格愿意开源价值100亿美元的Llama 3 大模型
Stability AI 推出开源音频大模型Stable Audio Open
返回列表
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
小哪吒
发表主题 1757
标签
大模型
(2)
openai
(37)
Meta
(11)
AR
(1)
扎克伯格
(5)
融资
(37)
出版
(1)
人工智能
(3)
报告
(4)
Sora
(6)
AI芯片
(8)
英伟达
(6)
知识图谱
(1)
AI
(26)
电商
(3)
产品建议
(1)
投资
(5)
AI视频
(3)
Pika
(1)
马斯克
(17)
豫ICP备2024052610号-1
©AI闹海