法国人工智能公司Mistral AI于10月16日宣布推出两款全新的边缘计算AI模型:Ministral 3B和Ministral 8B,统称为"les Ministraux"。这两款模型在10亿参数以下的AI模型中树立了新的性能标准,尤其适用于设备端计算和边缘计算场景。
Ministral 3B和8B模型在知识储备、常识推理、函数调用和计算效率等方面均有突出表现。它们支持高达128K的上下文长度,其中Ministral 8B还采用了特殊的交错滑动窗口注意力机制,以提高推理速度和内存效率。 这两款模型的推出正值Mistral AI首个开源模型Mistral 7B发布一周年之际。公司表示,新模型旨在满足客户对本地化、注重隐私的推理需求,适用于设备端翻译、离线智能助手、本地分析和自主机器人等应用场景。 据Mistral AI提供的基准测试结果显示,Ministral 3B和8B在多项任务中的表现均优于同类模型,甚至超越了一些参数量更大的模型。这一突破性进展展示了Mistral AI在小型高效AI模型开发方面的实力。
Mistral AI已将这两款模型上线其AI平台,并提供商业许可。研究用途的Ministral 8B Instruct模型权重也已开放下载。公司表示,这些模型不仅可以单独使用,还可以与更大的语言模型(如Mistral Large)结合,用于多步代理工作流中的函数调用。 随着边缘计算和设备端AI应用的需求不断增长,Mistral AI的这一举措无疑将为相关领域带来新的可能性。业内人士普遍认为,高效、小型的AI模型将在未来的智能设备和边缘计算场景中扮演越来越重要的角色。
|