萨姆·奥特曼 (Sam Altman)正在努力与苹果的 Siri 和亚马逊的 Alex 语音助手竞争。
OpenAI已提交商标申请,旨在打造“数字语音助手”和“语音引擎”,这意味着它可能即将发布新产品。
该申请于周二向美国专利商标局提交,此前一天,山姆·奥尔特曼 (Sam Altman) 接受了采访,他在采访中表示,OpenAI 在即将推出的 GPT-5 之前“还有很多其他重要的东西要发布”。
这些功能可能不会实现,因为公司经常为从未实现的想法提交商标申请。不过,据媒体报道,OpenAI 预计将在年中发布其 ChatGPT 模型的“实质性改进”升级版。
在接受媒体采访时,Sam Altman表示:“我们今年将发布一款令人惊叹的新车型。我不知道该给它起什么名字。我们将在未来几个月发布许多不同的东西,我认为它们会非常酷。”
他补充道:“我认为,在我们讨论类似 GPT-5 的模型(叫这个名字或不叫这个名字,或者比你对 GPT-5 的预期稍差一点或稍好一点)之前,我们还有很多其他重要的事情要先发布。”
该公司尚未向用户提供数字语音助手,但据其网站称,它确实有一个将语音转换为文本的 API,称为 TTS 。它还有一个名为 Whisper 的通用语音识别模型。
“语音工程师”商标申请正在等待审查员审查,拟涵盖以下 10 个领域的软件: - 构建数字语音助手
- 语音和语音识别、处理语音命令以及在文本和语音之间进行转换
- 处理语音命令,并在文本和语音之间进行转换
- 自动语音和声音识别与生成
- 根据自然语言提示、文本、语音、视觉提示、图像和/或视频生成语音和音频输出
- 根据用户提示生成音频和/或语音
- 基于机器学习的自然语言和语音处理
- 多语言语音识别、翻译和转录
- 使用人工智能自动进行文本到语音和文本到音频的转换
- 语音服务交付的发展
|