阿里发布开源代码大模型CodeQwen1.5

小哪吒

4月16日，阿里巴巴集团推出了其最新力作——CodeQwen1.5，一款卓越的开源编程助手，它在处理大型代码库方面表现出色，并且在代码修改能力上领先于同类产品。

由阿里千问团队精心打造的CodeQwen1.5包含两个模型：CodeQwen1.5-7B和CodeQwen1.5-7B-Chat，它们是基于Qwen1.5语言模型构建的专用代码生成大型语言模型（codeLLM）。

CodeQwen1.5经过3T代码相关数据的预训练，展现出在代码生成、长上下文建模（支持64K字符）、代码编辑和SQL处理方面的卓越性能。

在SWE-Bench竞赛中，尽管专有模型通常占据主导地位，CodeQwen1.5却以0.89的高分超越了ChatGPT-3.5，突显了开源代码LLM的巨大潜力，并领先于其他开源模型，如StarCoder2、CodeLlama、DeepSeek-Coder等。

CodeQwen1.5是一个基于7B参数的多语言代码生成模型，与现有的CodeLlama、StarCoder2等模型相比，在代码生成、长序列建模、代码修改等关键领域均有杰出表现。在HumanEval、MBPP等基准测试中，无论是0-shot还是3-shot的成绩，CodeQwen1.5均名列前茅，超越了GPT-3.5以及更大型的GPT-4模型。特别值得一提的是，CodeQwen1.5不仅在Python上表现出色，在C++、Java、JavaScript等主流编程语言上也展现了强大的功能，支持高达92种编程语言。

除了基础的代码生成能力，CodeQwen1.5在长序列建模方面同样具有明显优势。通过精心的数据收集和模型训练，该模型能够处理长达64K字符的输入，在处理大型代码库的问题上表现卓越。在一项名为"Needle in the Code"的合成评测中，CodeQwen1.5展现了其出色的长序列理解能力。此外，在更接近实际应用场景的SWEBench评测中，CodeQwen1.5也取得了优异的成绩，优于闭源的ChatGPT3.5。

在代码修改方面，CodeQwen1.5同样取得了显著成就。在CodeEditorBench的Debug、Translate、Switch、Polish等任务中，CodeQwen1.5在7B规模上达到了最佳效果，展现了其卓越的代码修改能力。

此外，CodeQwen1.5还展现了其作为SQL专家的能力，通过自然语言与数据库的高效互动，显著降低了非编程人员使用SQL的门槛。

有兴趣体验CodeQwen1.5的用户可以访问以下地址：

体验地址：https://huggingface.co/spaces/Qwen/CodeQwen1.5-7b-Chat-demo
官方博文：https://qwenlm.github.io/zh/blog/codeqwen1.5/

[行业动态] 阿里发布开源代码大模型CodeQwen1.5

相关帖子

Meta 确认下月发布开源大型语言模型Llama 3

李彦宏内部讲话曝光：提及文心大模型决定不开源的原因

2024.4.7-AI应用专题之三：阿里、字节、腾讯、百度AI应用梳理

360公司在 GitHub 上开源了 360 智脑 7B大模型

Meta发布最新开源大模型Llama 3，声称它是最好的开放模型之一

阿里、百度、字节、智谱等以低价打响大模型To B战争，留给其它厂商的时间不多了

阿里公布2024财年年报,明确定位:一个以用户为中心、AI驱动的企业

阿里公布投资 Kimi AI 开发商月之暗面细节：8 亿美元购入约 36% 股权

Qwen3新成员：Embedding系列模型登场！

离职员工发万字长文谈阿里，马云发帖回应