8月13日,人工智能公司xAI宣布推出新一代大型语言模型Grok-2和Grok-2 mini。两款模型现已在X平台(原Twitter)向Grok用户开放测试。
Grok-2是xAI的前沿语言模型,在聊天、编程和推理方面具有先进能力。在LMSYS排行榜上,Grok-2以"sus-column-r"的代号参与测试,目前表现超过了Claude 3.5 Sonnet和GPT-4-Turbo。 Grok-2 mini则是Grok-2的小型版本,提供速度和质量的平衡。两款模型都将于本月晚些时候通过企业API提供服务。
在学术基准测试中,Grok-2和Grok-2 mini在推理、阅读理解、数学、科学和编程等多个领域都显著优于前代Grok-1.5模型。特别是在研究生级科学知识(GPQA)、通用知识(MMLU、MMLU-Pro)和数学竞赛问题(MATH)等方面,两款新模型达到了与其他前沿模型相当的水平。
Grok-2还在视觉数学推理(MathVista)和基于文档的问答(DocVQA)等视觉任务中表现出色,达到了最先进的水平。 X平台的Premium和Premium+用户现可通过更新应用程序体验Grok-2和Grok-2 mini。新版Grok在界面设计和功能上都有所改进,能更好地整合X平台的实时信息。
xAI表示,自2023年11月发布Grok-1以来,公司发展迅速。未来将继续专注于提升AI的核心推理能力,并计划在未来几个月内推出更多创新。
此次发布标志着xAI在AI开发领域的重要进展,Grok-2系列模型有望为用户带来更智能、更直观的AI助手体验。
|