xAI旗下Grok-2登上聊天机器人排行榜第二：仅次于GPT-4，与Gemini 相持不下

小哪吒

LMSYS组织发布了最新的AI模型评测结果。这份备受关注的排行榜显示，Grok-2模型以77.2%的胜率位居第二，仅次于排名第一的GPT-4。

此次评测采用了Arena对战系统，通过大量人类评判来比较不同AI模型的表现。结果显示，GPT-4以83.4%的胜率保持领先地位，而Claude 3 Opus以75.9%的成绩紧随Grok-2之后，排名第三。

值得注意的是，Gemini Ultra 1.0的表现未能达到预期，以71.5%的胜率位列第四。这一结果引发了业内对Google AI实力的讨论。

Grok-2的优异表现令人惊喜，尤其考虑到其训练数据仅截至2023年12月。相比之下，GPT-4和Claude 3的训练数据更新至2023年底。这一成绩凸显了Grok-2在效率和性能方面的突破。

此次排名为AI领域的竞争格局带来了新的变数。随着各大科技公司不断推出新模型，AI技术的发展正呈现出快速迭代的态势。业内专家认为，这种良性竞争将推动AI技术的整体进步，最终惠及各行各业的应用场景。