2025年1月20日,月之暗面科技有限公司宣布其旗下智能助手Kimi的k1.5多模态思考模型正式上线。该模型在多模态推理和通用推理能力上达到行业领先水平,标志着Kimi在人工智能领域的又一次重要突破。
k1.5多模态思考模型是Kimi继k0-math数学模型和k1视觉思考模型之后的又一力作。在short-CoT模式下,k1.5的数学、代码、视觉多模态和通用能力大幅超越了全球范围内短思考SOTA模型GPT-4o和Claude 3.5 Sonnet,领先幅度高达550%。
在long-CoT模式下,k1.5的数学、代码、多模态推理能力也达到了长思考SOTA模型OpenAI o1正式版的水平,成为全球范围内OpenAI之外首个实现该性能的公司。
此次发布的k1.5多模态思考模型背后,是Kimi技术团队对模型训练技术的深入探索。他们首次公开了详细的技术报告《Kimi k1.5:借助大语言模型实现强化学习的Scaling》,记录了模型设计和训练的关键要素。报告指出,通过长上下文扩展和改进的策略优化,结合简洁的框架,Kimi能够在不依赖复杂技术的情况下实现强大性能。此外,k1.5模型在文本和视觉数据上联合训练,具备联合推理两种模态的能力,尤其在数学能力上表现出色,但在处理部分几何图形题时仍存在挑战。
k1.5多模态思考模型的预览版将陆续在Kimi.com网站和最新版本的Kimi智能助手app中上线。用户可以通过模型切换按钮体验这一全新功能。该模型擅长深度推理,能够帮助用户解决复杂的代码、数学和工作问题,为用户探索更广阔的世界提供助力。
|
声明:
本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!