月之暗面发布k1.5多模态思考模型

小哪吒

2025年1月20日，月之暗面科技有限公司宣布其旗下智能助手Kimi的k1.5多模态思考模型正式上线。该模型在多模态推理和通用推理能力上达到行业领先水平，标志着Kimi在人工智能领域的又一次重要突破。
k1.5多模态思考模型是Kimi继k0-math数学模型和k1视觉思考模型之后的又一力作。在short-CoT模式下，k1.5的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet，领先幅度高达550%。

在long-CoT模式下，k1.5的数学、代码、多模态推理能力也达到了长思考SOTA模型OpenAI o1正式版的水平，成为全球范围内OpenAI之外首个实现该性能的公司。

此次发布的k1.5多模态思考模型背后，是Kimi技术团队对模型训练技术的深入探索。他们首次公开了详细的技术报告《Kimi k1.5：借助大语言模型实现强化学习的Scaling》，记录了模型设计和训练的关键要素。报告指出，通过长上下文扩展和改进的策略优化，结合简洁的框架，Kimi能够在不依赖复杂技术的情况下实现强大性能。此外，k1.5模型在文本和视觉数据上联合训练，具备联合推理两种模态的能力，尤其在数学能力上表现出色，但在处理部分几何图形题时仍存在挑战。
k1.5多模态思考模型的预览版将陆续在Kimi.com网站和最新版本的Kimi智能助手app中上线。用户可以通过模型切换按钮体验这一全新功能。该模型擅长深度推理，能够帮助用户解决复杂的代码、数学和工作问题，为用户探索更广阔的世界提供助力。