本帖最后由 小哪吒 于 6-3 15:43 编辑
语音克隆初创公司ElevenLabs推出了一款新工具,用户可以通过提示生成音效。 该工具从今天开始向所有用户开放,用户可以输入“海浪拍打”、“金属铿锵声”、“鸟儿啁啾声”和“赛车引擎声”等提示来生成声音片段。 音效工具还可以生成长达 22 秒的器乐片段,其中包含吉他循环、爵士萨克斯独奏和音乐技术循环等提示。
免费用户每月可生成 10,000 个字符——每次请求生成一个声音字节大约需要 150 个字符。实际上,免费用户每月可以生成近 60 个音效。他们还必须在发布任何包含声音片段的内容时在标题中将声音归因于“elevenlabs.io”。
ElevenLabs 表示,它使用 Shutterstock 包含授权曲目的音频库作为训练其模型的工具,在 alpha 测试阶段试用该工具的用户包括视频游戏开发商、电影制片人、社交媒体内容创作者和营销人员。
ElevenLabs指出,该工具不允许通过违反其禁止内容和使用政策的提示产生声音,该政策包括自残、对儿童安全的威胁和欺诈等主题。
虽然已经有不少公司致力于人工智能声音生成,Stability AI 支持的Harmonai 发布了 Dance Diffusion;谷歌的MusicLM;OpenAI 有Jukebox;Meta 有其AudioCraft模型。
|