当前位置:»资讯 AI新闻 全球AI最前线

[行业动态] 阿里发布开源代码大模型CodeQwen1.5

WX20240417-193305@2x.png

4月16日,阿里巴巴集团推出了其最新力作——CodeQwen1.5,一款卓越的开源编程助手,它在处理大型代码库方面表现出色,并且在代码修改能力上领先于同类产品。

由阿里千问团队精心打造的CodeQwen1.5包含两个模型:CodeQwen1.5-7B和CodeQwen1.5-7B-Chat,它们是基于Qwen1.5语言模型构建的专用代码生成大型语言模型(codeLLM)。

CodeQwen1.5经过3T代码相关数据的预训练,展现出在代码生成、长上下文建模(支持64K字符)、代码编辑和SQL处理方面的卓越性能。

在SWE-Bench竞赛中,尽管专有模型通常占据主导地位,CodeQwen1.5却以0.89的高分超越了ChatGPT-3.5,突显了开源代码LLM的巨大潜力,并领先于其他开源模型,如StarCoder2、CodeLlama、DeepSeek-Coder等。

CodeQwen1.5是一个基于7B参数的多语言代码生成模型,与现有的CodeLlama、StarCoder2等模型相比,在代码生成、长序列建模、代码修改等关键领域均有杰出表现。在HumanEval、MBPP等基准测试中,无论是0-shot还是3-shot的成绩,CodeQwen1.5均名列前茅,超越了GPT-3.5以及更大型的GPT-4模型。特别值得一提的是,CodeQwen1.5不仅在Python上表现出色,在C++、Java、JavaScript等主流编程语言上也展现了强大的功能,支持高达92种编程语言。

除了基础的代码生成能力,CodeQwen1.5在长序列建模方面同样具有明显优势。通过精心的数据收集和模型训练,该模型能够处理长达64K字符的输入,在处理大型代码库的问题上表现卓越。在一项名为"Needle in the Code"的合成评测中,CodeQwen1.5展现了其出色的长序列理解能力。此外,在更接近实际应用场景的SWEBench评测中,CodeQwen1.5也取得了优异的成绩,优于闭源的ChatGPT3.5。

WX20240417-193333@2x.png

在代码修改方面,CodeQwen1.5同样取得了显著成就。在CodeEditorBench的Debug、Translate、Switch、Polish等任务中,CodeQwen1.5在7B规模上达到了最佳效果,展现了其卓越的代码修改能力。

WX20240417-193352@2x.png

此外,CodeQwen1.5还展现了其作为SQL专家的能力,通过自然语言与数据库的高效互动,显著降低了非编程人员使用SQL的门槛。

有兴趣体验CodeQwen1.5的用户可以访问以下地址:

声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海