法国人工智能公司 Mistral 推出了一种新的编码模型 Codestral,与现有模型相比,该模型具有较高的编码性能和较少的计算成本。
据 Mistral 介绍,Codestral 可处理 80 多种编程语言,包括 Python、Java、C、C++、JavaScript 和 Bash 等常见语言,以及 Swift 和 Fortran 等更专业的语言。功能包括代码完成、测试编写以及填充不完整的代码。
Mistral 声称,Codestral 是一个拥有 220 亿个参数的模型,与现有模型相比,它为代码生成的性能/延迟比树立了新标准。Codestral 拥有更大的32K上下文窗口,在 RepoBench(较长代码生成的基准)中胜过所有其他模型。 由于具有 32K 上下文窗口,Codestral 被认为特别擅长处理长代码任务。
Mistral 将 Codestral 在 Python、SQL 和其他语言的各种基准测试中的表现与对硬件要求更高的竞争模型进行了比较。Codestral 的表现始终更佳,例如在远距离完成代码存储库或预测 Python 输出方面。 在著名的 HumanEval 代码基准测试中,Codestral 的表现略胜于体型更大的 Llama 3 70B。
HuggingFace地址:https://huggingface.co/mistralai/Codestral-22B-v0.1
|