Anthropic推出Claude 3.5 Sonnet，全球最强大模型，吊打OpenAI和谷歌

小哪吒

Anthropic推出Claude 3.5 Sonnet，这是其迄今为止全球最强的人工智能模型。

Claude 3.5 Sonnet，作为即将推出的Claude 3.5系列的首发产品，已正式亮相。这款产品在多项行业评估中超越了竞争对手以及前代Claude 3 Opus，同时在速度和成本上与中端型号Claude 3 Sonnet持平。

目前，Claude 3.5 Sonnet已在Claude.ai平台和iOS应用程序上免费提供。对于订阅了Claude Pro和Team计划的用户，他们可以享受到更高的访问速率。此外，该模型也可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI进行访问。其定价策略为每百万输入令牌3美元，每百万输出令牌15美元，支持200K令牌的上下文窗口。

在研究生水平推理（GPQA）、本科生水平知识（MMLU）和编码能力（HumanEval）的评估中，Claude 3.5 Sonnet设定了新的行业标准。它在理解细微差别、幽默和复杂指令方面表现出显著进步，擅长以自然、友好的语调创作高质量内容。

Claude 3.5 Sonnet的运行速度是Claude 3 Opus的两倍，这一性能提升结合其经济实惠的价格，使其成为处理复杂任务的理想选择，例如上下文相关的客户支持和协调多步骤工作流程。

在内部代理编码评估中，Claude 3.5 Sonnet解决了64%的问题，显著优于Claude 3 Opus的38%。该模型在给出自然语言描述的情况下，展现出了修复错误或向开源代码库添加功能的能力。在指导和工具的支持下，Claude 3.5 Sonnet能够独立编写、编辑和执行代码，展现出复杂的推理和故障排除能力。

Claude 3.5 Sonnet也是迄今为止最强大的视觉模型，在标准视觉基准测试中超越了Claude 3 Opus。这些重大改进对于需要视觉推理的任务尤为明显，例如解释图表和图形。此外，它还能从不完美的图像中准确转录文本，这对于零售、物流和金融服务等行业至关重要。

Claude.ai平台还推出了一项名为Artifacts的新功能，它扩展了用户与Claude的互动方式。当用户请求生成代码片段、文本文档或网站设计等内容时，Artifacts会在专用窗口中与对话一起显示。这创建了一个动态工作区，用户可以实时查看、编辑和构建Claude的创作，将AI生成的内容无缝集成到他们的项目和工作流程中。

Claude.ai致力于安全和隐私。Claude 3.5 Sonnet经过了严格的测试，并经过训练以减少误用。尽管智能有显著提升，但根据红队评估，仍处于ASL-2水平。作为对安全和透明度承诺的一部分，Claude.ai与外部专家合作，测试和改进安全机制，并与英国人工智能安全研究所（UK AISI）合作进行了部署前安全评估。

Claude.ai整合了外部政策专家的反馈，确保评估是稳健的，并考虑到滥用的新趋势。团队利用Thorn儿童安全专家的反馈来更新分类器并微调模型。隐私是AI模型开发的核心原则之一，除非用户明确允许，否则不会使用用户提交的数据来训练生成模型。

Claude.ai的目标是每隔几个月就显著改善智能、速度和成本之间的权衡。今年晚些时候，将发布Claude 3.5 Haiku和Claude 3.5 Opus，以完善型号系列。此外，团队正在开发新模式和功能，以支持更多企业用例，包括与企业应用程序的集成。团队还在探索Memory等功能，这将使Claude能够记住用户的偏好和指定的交互历史，从而提供更个性化和高效的体验。

[行业动态] Anthropic推出Claude 3.5 Sonnet，全球最强大模型，吊打OpenAI和谷歌

相关帖子

最强的大模型：Anthropic发布Claude 3，超越GPT-4和Gemini Ultra

人工智能公司 Anthropic获得亚马逊追加的27.5 亿美元投资

Anthropic 推出针对企业的高端订阅计划

与ChatGPT相比，Anthropic的Claude APP在IOS上表现一般，下载量远不及预期

Anthropic 的AI 助手 Claude 在欧洲上线，支持多语言服务

Instagram联合创始人Mike Krieger加盟Anthropic，担任首席产品官

Anthropic 发布Android版 Claude 应用

Claude Code 将支持远程 MCP 服务器