ElevenLabs近日宣布其最新语音转文字模型Scribe正式上线,并在用户界面与API中投入使用。该模型以其卓越的准确性和广泛的多语言支持迅速受到关注。Scribe在基准测试中表现出色,超越了Gemini 2.0和OpenAI Whisper v3等先前的顶尖模型,成为英语、西班牙语、意大利语等多种语言的领先模型。此外,Scribe还显著提升了塞尔维亚语、粤语和古吉拉特语等此前服务不足的语言的性能。
Scribe支持99种语言的语音转文字功能,并具备多说话人的识别能力。其定价为每小时输入音频0.40美元,未来六周内提供50%的折扣优惠。用户可通过ElevenLabs官网注册账号使用该服务。ElevenLabs还计划推出低延迟版本的Scribe,以满足实时应用场景的需求。
ElevenLabs的研究团队表示,Scribe的开发旨在提供更智能的音频理解解决方案,其高精度和多语言支持能力将为语音转文字领域带来新的突破。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!