当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] OpenAI 的最新语音引擎工具可在 15 秒内复制人类声音

WX20240331-093945@2x.png

OpenAI推出了一款新工具,仅需 15 秒的录音就可以重现人的声音。

该模型被称为语音引擎,它只需要一段 15 秒的视频就能学习人的声音和说话方式。然后,用户可以输入文本,让它用包含情感的逼真声音说出他们想说的任何话。该公司表示,它在 2022 年开发了语音引擎,并在预设声音中使用了它,但这是第一次讨论利用人的真实声音。

OpenAI 在一篇博客文章中写道:“由于合成语音可能被滥用,因此我们对更广泛地发布该功能采取谨慎和知情的态度。我们希望就负责任地部署合成语音以及社会如何适应这些新功能展开对话。”

OpenAI 补充道,根据这些对话的进展情况,它将决定如何(甚至是否)向公众发布语音引擎。

该公司写道:“我们将做出更明智的决定,考虑是否以及如何大规模部署这项技术。”

语音引擎的影响是巨大的。虽然它可以用于各种显著的用途,例如快速录制演示文稿或更有效地沟通,但捕捉他人的声音并将其用于邪恶目的并不困难。事实上,许多此类骗局已经存在,它们被用来欺骗人们向骗子汇款和分享信息。

WX20240331-095247@2x.png


OpenAI 认为,正是因为存在这种风险,所以获得反馈才如此重要。该公司表示,它正在与美国和国际上的政府、媒体公司、娱乐公司和教育机构合作,讨论语音引擎。这些各方目前正在测试语音引擎,并同意不冒充他人。他们还必须向任何收听音频的人披露该声音是由人工智能生成的。OpenAI 还添加了水印,这样听众就会知道该声音不是真实的。

该公司表示:“我们认为,任何广泛部署的合成语音技术都应伴随语音认证体验,以验证原始说话者是否有意识地将自己的声音添加到服务中,以及一个禁止使用的声音列表,以检测和防止创建与知名人物太相似的声音。”

展望未来,语音引擎的前景尚不明朗。虽然最终可能会公开,但 OpenAI 也可能认为这不符合公众的最佳利益。无论如何,该公司表示,语音引擎显然是可以开发的,而且它显然已经存在。“重要的是,世界各地的人们都了解这项技术的发展方向,”该公司表示,“无论我们最终是否会广泛部署它。”

声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海