ElevenLabs推出新一代语音转文字模型Scribe

小哪吒

ElevenLabs近日宣布其最新语音转文字模型Scribe正式上线，并在用户界面与API中投入使用。该模型以其卓越的准确性和广泛的多语言支持迅速受到关注。Scribe在基准测试中表现出色，超越了Gemini 2.0和OpenAI Whisper v3等先前的顶尖模型，成为英语、西班牙语、意大利语等多种语言的领先模型。此外，Scribe还显著提升了塞尔维亚语、粤语和古吉拉特语等此前服务不足的语言的性能。

Scribe支持99种语言的语音转文字功能，并具备多说话人的识别能力。其定价为每小时输入音频0.40美元，未来六周内提供50%的折扣优惠。用户可通过ElevenLabs官网注册账号使用该服务。ElevenLabs还计划推出低延迟版本的Scribe，以满足实时应用场景的需求。
ElevenLabs的研究团队表示，Scribe的开发旨在提供更智能的音频理解解决方案，其高精度和多语言支持能力将为语音转文字领域带来新的突破。