Kimi 发布视觉思考模型 k1，多项理科测试行业领先

小哪吒

北京月之暗面科技有限公司推出其开发的Kimi智能助手推出新一代视觉思考模型k1，该模型基于强化学习技术，实现了端到端的图像理解和思考能力。k1模型在数学、物理、化学等基础科学领域的基准测试中表现卓越，超越了全球标杆模型，包括OpenAI o1、GPT-4o以及Claude 3.5 Sonnet。

k1模型的发布标志着AI在图像理解与思维链技术方面迈出了重要一步。该模型能够直接处理图像信息并得出答案，无需依赖外部OCR或视觉模型，极大提升了用户体验。在OCRBench上，k1模型以903分的成绩刷新了最佳记录，同时在MathVista-testmini、MMMU-val和DocVQA基准测试集中也取得了全球领先水平的分数。

k1模型的训练分为预训练和强化学习后训练两个阶段，其中强化学习后训练在数据质量和学习效率方面进行了优化，实现了规模化的新突破。此外，Kimi模型研发团队还构建了标准化测试集Science Vista，涵盖数理化图片题目，该测试集将对全行业开放。

尽管k1模型在内部测试中展现了强大的能力，团队也意识到模型在泛化、复杂问题解决、噪声场景准确率以及多轮问答效果等方面仍有提升空间。月之暗面科技承诺将持续优化k1模型，拓展其在更多领域的应用，以满足用户对图像理解和思考能力的需求。

Kimi视觉思考模型k1现已上线，用户可通过最新版Kimi智能助手的Android和iPhone手机APP以及网页版kimi.com体验。这一进步不仅提升了Kimi智能助手的图像理解能力，也为AI行业的发展注入了新动力。