法国人工智能公司Mistral AI于7月24日推出其最新旗舰模型Mistral Large 2,在代码生成、数学和多语言支持方面实现了重大突破。该模型拥有1230亿参数,支持128K上下文窗口,可处理80多种编程语言,并在MMLU基准测试中达到84.0%的准确率,超越了Meta最近发布的Llama 3.1模型。 Mistral Large 2的主要特点包括: 强大的多语言能力,支持英语、法语、德语、西班牙语和中文等数十种语言。 卓越的代码生成能力,支持Python、Java、C++等80多种编程语言。 改进的指令跟随和对话能力,在MT-Bench等基准测试中表现出色。 增强的函数调用技能,适用于复杂的商业应用。 专注于减少幻觉并确保输出准确性,显著提升推理和问题解决能力。
该模型目前以研究许可证发布,仅供非商业用途使用。用户可通过la Plateforme平台访问Mistral Large 2,代号为mistral-large-2407。此外,Mistral AI还与谷歌云平台、微软Azure AI Studio、亚马逊Bedrock和IBM watsonx.ai等合作,扩大其模型的可访问性。
Mistral AI在过去一周内共发布了四个模型,包括专门用于数学推理的MathΣtral、基于Mamba 2架构的Codestral Mamba 7B,以及与NVIDIA合作开发的Mistral NeMo。这些模型的推出彰显了Mistral AI在人工智能领域的快速发展和创新能力。
https://huggingface.co/mistralai
|