马斯克xAI发布Grok-2/Grok-2 mini AI模型

小哪吒

8月13日，人工智能公司xAI宣布推出新一代大型语言模型Grok-2和Grok-2 mini。两款模型现已在X平台(原Twitter)向Grok用户开放测试。

Grok-2是xAI的前沿语言模型，在聊天、编程和推理方面具有先进能力。在LMSYS排行榜上，Grok-2以"sus-column-r"的代号参与测试，目前表现超过了Claude 3.5 Sonnet和GPT-4-Turbo。

Grok-2 mini则是Grok-2的小型版本，提供速度和质量的平衡。两款模型都将于本月晚些时候通过企业API提供服务。

在学术基准测试中，Grok-2和Grok-2 mini在推理、阅读理解、数学、科学和编程等多个领域都显著优于前代Grok-1.5模型。特别是在研究生级科学知识(GPQA)、通用知识(MMLU、MMLU-Pro)和数学竞赛问题(MATH)等方面，两款新模型达到了与其他前沿模型相当的水平。

Grok-2还在视觉数学推理(MathVista)和基于文档的问答(DocVQA)等视觉任务中表现出色，达到了最先进的水平。

X平台的Premium和Premium+用户现可通过更新应用程序体验Grok-2和Grok-2 mini。新版Grok在界面设计和功能上都有所改进，能更好地整合X平台的实时信息。

xAI表示，自2023年11月发布Grok-1以来，公司发展迅速。未来将继续专注于提升AI的核心推理能力，并计划在未来几个月内推出更多创新。

此次发布标志着xAI在AI开发领域的重要进展，Grok-2系列模型有望为用户带来更智能、更直观的AI助手体验。