本帖最后由 小哪吒 于 3-29 12:02 编辑
3 月 28 日——埃隆·马斯克旗下人工智能初创公司 xAI 周四表示,将推出聊天机器人 Grok 的增强版Grok-1.5 。
该初创公司表示,新版本最显着的改进之一是其在编码和数学相关任务中的性能。
能力与推理
Grok-1.5 最显着的改进之一是其在编码和数学相关任务中的性能。在我们的测试中,Grok-1.5 在 MATH 基准上取得了 50.6% 的成绩,在 GSM8K 基准上取得了 90% 的成绩,这两个数学基准涵盖了广泛的小学到高中的竞赛问题。此外,它在评估代码生成和解决问题能力的 HumanEval 基准测试中得分为 74.1%。
长上下文理解
Grok-1.5 中的一个新功能是能够在其上下文窗口内处理多达 128K 个令牌的长上下文。这使得 Grok 的内存容量增加到之前上下文长度的 16 倍,从而能够利用更长文档中的信息。
此外,该模型可以处理更长、更复杂的提示,同时在上下文窗口扩展时仍然保持其指令跟踪能力。在大海捞针(NIAH)评估中,Grok-1.5展示了强大的检索能力,可以在长度高达128K token的上下文中嵌入文本,实现完美的检索结果。
|