当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] Anthropic推出Claude 3.5 Sonnet,全球最强大模型,吊打OpenAI和谷歌

1f044104447e9db6b22db3a06e45d114f50f274e-2200x1174.webp
Anthropic推出Claude 3.5 Sonnet,这是其迄今为止全球最强的人工智能模型



Claude 3.5 Sonnet,作为即将推出的Claude 3.5系列的首发产品,已正式亮相。这款产品在多项行业评估中超越了竞争对手以及前代Claude 3 Opus,同时在速度和成本上与中端型号Claude 3 Sonnet持平。

目前,Claude 3.5 Sonnet已在Claude.ai平台和iOS应用程序上免费提供。对于订阅了Claude Pro和Team计划的用户,他们可以享受到更高的访问速率。此外,该模型也可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI进行访问。其定价策略为每百万输入令牌3美元,每百万输出令牌15美元,支持200K令牌的上下文窗口。

在研究生水平推理(GPQA)、本科生水平知识(MMLU)和编码能力(HumanEval)的评估中,Claude 3.5 Sonnet设定了新的行业标准。它在理解细微差别、幽默和复杂指令方面表现出显著进步,擅长以自然、友好的语调创作高质量内容。

Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍,这一性能提升结合其经济实惠的价格,使其成为处理复杂任务的理想选择,例如上下文相关的客户支持和协调多步骤工作流程。

在内部代理编码评估中,Claude 3.5 Sonnet解决了64%的问题,显著优于Claude 3 Opus的38%。该模型在给出自然语言描述的情况下,展现出了修复错误或向开源代码库添加功能的能力。在指导和工具的支持下,Claude 3.5 Sonnet能够独立编写、编辑和执行代码,展现出复杂的推理和故障排除能力。
cf2c754458e9102b7334731fb18a965bfeb7ad08-2200x1894.webp

Claude 3.5 Sonnet也是迄今为止最强大的视觉模型,在标准视觉基准测试中超越了Claude 3 Opus。这些重大改进对于需要视觉推理的任务尤为明显,例如解释图表和图形。此外,它还能从不完美的图像中准确转录文本,这对于零售、物流和金融服务等行业至关重要。
caff3d60763b27b59fe33e4ae984530f0dba4ddb-2200x1110.webp

Claude.ai平台还推出了一项名为Artifacts的新功能,它扩展了用户与Claude的互动方式。当用户请求生成代码片段、文本文档或网站设计等内容时,Artifacts会在专用窗口中与对话一起显示。这创建了一个动态工作区,用户可以实时查看、编辑和构建Claude的创作,将AI生成的内容无缝集成到他们的项目和工作流程中。

Claude.ai致力于安全和隐私。Claude 3.5 Sonnet经过了严格的测试,并经过训练以减少误用。尽管智能有显著提升,但根据红队评估,仍处于ASL-2水平。作为对安全和透明度承诺的一部分,Claude.ai与外部专家合作,测试和改进安全机制,并与英国人工智能安全研究所(UK AISI)合作进行了部署前安全评估。

Claude.ai整合了外部政策专家的反馈,确保评估是稳健的,并考虑到滥用的新趋势。团队利用Thorn儿童安全专家的反馈来更新分类器并微调模型。隐私是AI模型开发的核心原则之一,除非用户明确允许,否则不会使用用户提交的数据来训练生成模型。

Claude.ai的目标是每隔几个月就显著改善智能、速度和成本之间的权衡。今年晚些时候,将发布Claude 3.5 Haiku和Claude 3.5 Opus,以完善型号系列。此外,团队正在开发新模式和功能,以支持更多企业用例,包括与企业应用程序的集成。团队还在探索Memory等功能,这将使Claude能够记住用户的偏好和指定的交互历史,从而提供更个性化和高效的体验。


声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海