Anthropic推出Sonnet和Haiku升级版本，同时引入突破性的"控制电脑"功能

小哪吒

美国人工智能公司Anthropic于10月22日宣布对其AI助手Claude进行重要升级，推出Claude 3.5 Sonnet升级版和全新的Claude 3.5 Haiku版本，同时首次引入突破性的"控制电脑"功能。

最引人注目的是Claude新增的电脑操作能力。通过这项目前处于公测阶段的功能，Claude能够像人类一样操作电脑——查看屏幕、移动光标、点击按钮和输入文字。这使得Claude成为首个具备此类能力的主流AI模型。

升级后的Claude 3.5 Sonnet在多个领域都有显著提升，特别是在编程方面的表现更为出色。在SWE-bench Verified测试中，其成绩从33.4%提升至49.0%，超越了包括OpenAI在内的所有公开可用模型。GitLab、Cognition等早期测试用户反馈，新版本在推理能力上提升了约10%，且没有增加延迟。

全新推出的Claude 3.5 Haiku则在保持高速处理能力的同时，性能达到了此前顶级版本Claude 3 Opus的水平。该版本在编程任务上表现同样优异，在SWE-bench Verified测试中得分40.6%，超越了包括原版Claude 3.5 Sonnet在内的多个主流模型。

Anthropic合作伙伴Asana、Canva、DoorDash等公司已开始探索新功能的应用可能。例如，Replit正在利用Claude的电脑操作能力开发其Replit Agent产品的核心功能。

值得注意的是，Anthropic对新功能的安全性给予了高度重视。公司与美国和英国AI安全研究所合作进行了部署前测试，并开发了新的分类器来识别计算机使用行为是否存在潜在风险。

目前，升级版Claude 3.5 Sonnet已向所有用户开放，开发者可以通过Anthropic API、亚马逊Bedrock和谷歌Cloud Vertex AI平台使用电脑操作功能的测试版。Claude 3.5 Haiku计划于本月晚些时候发布。

这次升级展现了Anthropic在AI领域的持续创新能力，特别是在提升AI实用性方面迈出了重要一步。随着技术的不断完善，Claude的电脑操作能力有望为自动化工作流程和人机协作带来新的可能。