北京月之暗面科技有限公司推出其开发的Kimi智能助手推出新一代视觉思考模型k1,该模型基于强化学习技术,实现了端到端的图像理解和思考能力。k1模型在数学、物理、化学等基础科学领域的基准测试中表现卓越,超越了全球标杆模型,包括OpenAI o1、GPT-4o以及Claude 3.5 Sonnet。
k1模型的发布标志着AI在图像理解与思维链技术方面迈出了重要一步。该模型能够直接处理图像信息并得出答案,无需依赖外部OCR或视觉模型,极大提升了用户体验。在OCRBench上,k1模型以903分的成绩刷新了最佳记录,同时在MathVista-testmini、MMMU-val和DocVQA基准测试集中也取得了全球领先水平的分数。 k1模型的训练分为预训练和强化学习后训练两个阶段,其中强化学习后训练在数据质量和学习效率方面进行了优化,实现了规模化的新突破。此外,Kimi模型研发团队还构建了标准化测试集Science Vista,涵盖数理化图片题目,该测试集将对全行业开放。 尽管k1模型在内部测试中展现了强大的能力,团队也意识到模型在泛化、复杂问题解决、噪声场景准确率以及多轮问答效果等方面仍有提升空间。月之暗面科技承诺将持续优化k1模型,拓展其在更多领域的应用,以满足用户对图像理解和思考能力的需求。 Kimi视觉思考模型k1现已上线,用户可通过最新版Kimi智能助手的Android和iPhone手机APP以及网页版kimi.com体验。这一进步不仅提升了Kimi智能助手的图像理解能力,也为AI行业的发展注入了新动力。
|