美国人工智能公司Anthropic于10月22日宣布对其AI助手Claude进行重要升级,推出Claude 3.5 Sonnet升级版和全新的Claude 3.5 Haiku版本,同时首次引入突破性的"控制电脑"功能。
最引人注目的是Claude新增的电脑操作能力。通过这项目前处于公测阶段的功能,Claude能够像人类一样操作电脑——查看屏幕、移动光标、点击按钮和输入文字。这使得Claude成为首个具备此类能力的主流AI模型。 升级后的Claude 3.5 Sonnet在多个领域都有显著提升,特别是在编程方面的表现更为出色。在SWE-bench Verified测试中,其成绩从33.4%提升至49.0%,超越了包括OpenAI在内的所有公开可用模型。GitLab、Cognition等早期测试用户反馈,新版本在推理能力上提升了约10%,且没有增加延迟。 全新推出的Claude 3.5 Haiku则在保持高速处理能力的同时,性能达到了此前顶级版本Claude 3 Opus的水平。该版本在编程任务上表现同样优异,在SWE-bench Verified测试中得分40.6%,超越了包括原版Claude 3.5 Sonnet在内的多个主流模型。
Anthropic合作伙伴Asana、Canva、DoorDash等公司已开始探索新功能的应用可能。例如,Replit正在利用Claude的电脑操作能力开发其Replit Agent产品的核心功能。
值得注意的是,Anthropic对新功能的安全性给予了高度重视。公司与美国和英国AI安全研究所合作进行了部署前测试,并开发了新的分类器来识别计算机使用行为是否存在潜在风险。
目前,升级版Claude 3.5 Sonnet已向所有用户开放,开发者可以通过Anthropic API、亚马逊Bedrock和谷歌Cloud Vertex AI平台使用电脑操作功能的测试版。Claude 3.5 Haiku计划于本月晚些时候发布。
这次升级展现了Anthropic在AI领域的持续创新能力,特别是在提升AI实用性方面迈出了重要一步。随着技术的不断完善,Claude的电脑操作能力有望为自动化工作流程和人机协作带来新的可能。
|